@Tak2님이 소개한 Groq(그록?) API을 이용해 llama3 모델을 돌려보는데 이게 그닥...

@Tak2님이 소개한 Groq(그록?) API을 이용해 llama3 모델을 돌려보는데 이게 그닥... > 자유게시판

자유게시판

@Tak2님이 소개한 Groq(그록?) API을 이용해 llama3 모델을 돌려보는데 이게 그닥... 정보

@Tak2님이 소개한 Groq(그록?) API을 이용해 llama3 모델을 돌려보는데 이게 그닥...

Gothrock 자기소개 아이디로 검색 회원게시물 (175.♡.♡.73)
2025.02.01 05:02:10
조회 833
댓글 7

본문

@Tak2 님이 소개한 그록 게시물 ai 기능 추가 > 자유게시판

2948608585_1738353382.6637.gif

대충 Chat-gpt에게 물어 러프한 화면구성을 하고 테스트를 해보는데 라마3엔진이 기대 이상으로 별로인데요? 제가 유료만 이용해서인 이유도 있겠지만 현격하게 수준이 떨어집니다.

테스트URL: PHP Groq AI 챗봇 (한글 전용)

P.S...테스트 페이지의 AI모델은 그록 API 무료 플랜의 'llama3-8b-8192' 엔진 이고 원활한 소통을 위해 미리 한글 사용에 대한 암시를 준 상태입니다. 까페24시 호스팅 중 극저렴 플랜이라 트래픽 제한이 있을 수 있습니다.

새벽까지 바둑을 두다 이제 들어와 테스트 페이지 만들어 테스트를 해봤고 게시판은 자고 나서나 붙여야겠네요.

연휴 참...좋았는데...

연휴무상....ㅠㅠ

댓글 7개

Tak2 홈페이지 자기소개 아이디로 검색 회원게시물

홈페이지 자기소개 아이디로 검색 회원게시물

(58.♡.♡.149)

25.02.01 05:13:31 모바일

llama-3.3-70b-specdec 모델 또는 llama-3.3-70b-versatile이 제일 성능이 좋은 것 같습니다. llama3-8b-8192는 구버전이라 별로라고 느껴지실 수도 있어요.

제일 추천하는 것은

1. llama-3.3-70b-specdec / llama-3.3-70b-versatile

2. gemma2-9b-it

입니다. 나머지는 영..

Gothrock 자기소개 아이디로 검색 회원게시물

자기소개 아이디로 검색 회원게시물

(175.♡.♡.73)

25.02.01 05:19:33 모바일

@Tak2 그렇군요. 자고나서 바꿔 테스트를 해봐야겠습니다. 덕분에 라마를 간접체험해봅니다~!

Tak2 홈페이지 자기소개 아이디로 검색 회원게시물

홈페이지 자기소개 아이디로 검색 회원게시물

(58.♡.♡.149)

25.02.01 05:21:24 모바일

@Gothrock 싼게 비지떡인 것 같습니다. 그래도 다양한 기능을 체험해볼 수 있다는게 좋은 것 같아요. (어서 주무시길..)

수평선1203 자기소개 아이디로 검색 회원게시물

자기소개 아이디로 검색 회원게시물

(120.♡.♡.246)

25.02.01 09:40:10

딥시크 소스를 내려받았는데 까보니 라마소스를 참고했다고 주석에 나와있네요.

유튜브 영상을 보니 14빌리언모델은 pc에서 그럭저럭 돌아간다고 하네요.


# Copied from transformers.models.llama.modeling_llama.LlamaLinearScalingRotaryEmbedding with Llama->DeepseekV3
class DeepseekV3LinearScalingRotaryEmbedding(DeepseekV3RotaryEmbedding):
    """DeepseekV3RotaryEmbedding extended with linear scaling. Credits to the Reddit user /u/kaiokendev"""
    def __init__(
        self,
        dim,
        max_position_embeddings=2048,
        base=10000,
        device=None,
        scaling_factor=1.0,
    ):
        self.scaling_factor = scaling_factor
        super().__init__(dim, max_position_embeddings, base, device)
    def _set_cos_sin_cache(self, seq_len, device, dtype):
        self.max_seq_len_cached = seq_len
        t = torch.arange(
            self.max_seq_len_cached, device=device, dtype=self.inv_freq.dtype
        )
        t = t / self.scaling_factor
        freqs = torch.outer(t, self.inv_freq)
        # Different from paper, but it uses a different permutation in order to obtain the same calculation
        emb = torch.cat((freqs, freqs), dim=-1)
        self.register_buffer("cos_cached", emb.cos().to(dtype), persistent=False)
        self.register_buffer("sin_cached", emb.sin().to(dtype), persistent=False)

딥시크 소스를 내려받았는데 까보니 라마소스를 참고했다고 주석에 나와있네요.

유튜브 영상을 보니 14빌리언모델은 pc에서 그럭저럭 돌아간다고 하네요.

[code]

# Copied from transformers.models.llama.modeling_llama.LlamaLinearScalingRotaryEmbedding with Llama-&gt;DeepseekV3
class DeepseekV3LinearScalingRotaryEmbedding(DeepseekV3RotaryEmbedding):
    """DeepseekV3RotaryEmbedding extended with linear scaling. Credits to the Reddit user /u/kaiokendev"""

def __init__(
        self,
        dim,
        max_position_embeddings=2048,
        base=10000,
        device=None,
        scaling_factor=1.0,
    ):
        self.scaling_factor = scaling_factor
        super().__init__(dim, max_position_embeddings, base, device)

def _set_cos_sin_cache(self, seq_len, device, dtype):
        self.max_seq_len_cached = seq_len
        t = torch.arange(
            self.max_seq_len_cached, device=device, dtype=self.inv_freq.dtype
        )
        t = t / self.scaling_factor

freqs = torch.outer(t, self.inv_freq)
        # Different from paper, but it uses a different permutation in order to obtain the same calculation
        emb = torch.cat((freqs, freqs), dim=-1)
        self.register_buffer("cos_cached", emb.cos().to(dtype), persistent=False)
        self.register_buffer("sin_cached", emb.sin().to(dtype), persistent=False)

[/code]