@Tak2님이 소개한 Groq(그록?) API을 이용해 llama3 모델을 돌려보는데 이게 그닥... > 자유게시판

자유게시판

@Tak2님이 소개한 Groq(그록?) API을 이용해 llama3 모델을 돌려보는데 이게 그닥... 정보

@Tak2님이 소개한 Groq(그록?) API을 이용해 llama3 모델을 돌려보는데 이게 그닥...

본문

 님이 소개한 그록 게시물 ai 기능 추가 > 자유게시판

 

2948608585_1738353382.6637.gif

 

대충 Chat-gpt에게 물어 러프한 화면구성을 하고 테스트를 해보는데 라마3엔진이 기대 이상으로 별로인데요? 제가 유료만 이용해서인 이유도 있겠지만 현격하게 수준이 떨어집니다.

 

테스트URL: PHP Groq AI 챗봇 (한글 전용)

 

P.S...테스트 페이지의 AI모델은 그록 API 무료 플랜의 'llama3-8b-8192' 엔진 이고 원활한 소통을 위해 미리 한글 사용에 대한 암시를 준 상태입니다. 까페24시 호스팅 중 극저렴 플랜이라 트래픽 제한이 있을 수 있습니다.

 

새벽까지 바둑을 두다 이제 들어와 테스트 페이지 만들어 테스트를 해봤고 게시판은 자고 나서나 붙여야겠네요.

 

연휴 참...좋았는데...

 

연휴무상....ㅠㅠ

 

 

추천
1

댓글 7개

llama-3.3-70b-specdec 모델 또는 llama-3.3-70b-versatile이 제일 성능이 좋은 것 같습니다. llama3-8b-8192는 구버전이라 별로라고 느껴지실 수도 있어요.

제일 추천하는 것은

1. llama-3.3-70b-specdec / llama-3.3-70b-versatile

2. gemma2-9b-it

입니다. 나머지는 영..

@Gothrock 싼게 비지떡인 것 같습니다. 그래도 다양한 기능을 체험해볼 수 있다는게 좋은 것 같아요. (어서 주무시길..)

딥시크 소스를 내려받았는데 까보니 라마소스를 참고했다고 주석에 나와있네요.

유튜브 영상을 보니 14빌리언모델은 pc에서 그럭저럭 돌아간다고 하네요.


# Copied from transformers.models.llama.modeling_llama.LlamaLinearScalingRotaryEmbedding with Llama->DeepseekV3
class DeepseekV3LinearScalingRotaryEmbedding(DeepseekV3RotaryEmbedding):
    """DeepseekV3RotaryEmbedding extended with linear scaling. Credits to the Reddit user /u/kaiokendev"""
    def __init__(
        self,
        dim,
        max_position_embeddings=2048,
        base=10000,
        device=None,
        scaling_factor=1.0,
    ):
        self.scaling_factor = scaling_factor
        super().__init__(dim, max_position_embeddings, base, device)
    def _set_cos_sin_cache(self, seq_len, device, dtype):
        self.max_seq_len_cached = seq_len
        t = torch.arange(
            self.max_seq_len_cached, device=device, dtype=self.inv_freq.dtype
        )
        t = t / self.scaling_factor
        freqs = torch.outer(t, self.inv_freq)
        # Different from paper, but it uses a different permutation in order to obtain the same calculation
        emb = torch.cat((freqs, freqs), dim=-1)
        self.register_buffer("cos_cached", emb.cos().to(dtype), persistent=False)
        self.register_buffer("sin_cached", emb.sin().to(dtype), persistent=False)

@수평선1203 라마나 다른, 오픈llm을 이용해 입찰 견적서를 자동으로 만들게 하고 싶은데 시간이 없네요. 사실 시간이 없다기 보다는 매일 매일이 치이다 보니 정신적인 여유가 없는 듯 합니다.

전체 198,233 |RSS
자유게시판 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT