2024-01-19から1日間の記事一覧

2024-01-19

日本語LLMの評価についてプロンプトバージョンによる得意不得意を調べてみた

はじめに評価対象評価方法プロンプトの中身 0.2: FintanPrompt 0.3: AlpacaPrompt 0.4: RinnaInstructionSFT 0.5: RinnaBilingualInstructionSFT 0.6: Llama2 評価結果おわりにはじめに LLMの日本語に関する評価にはJGLUEデータセットを使用するlm-eval…

HEROZ Tech Blog

日本将棋連盟公認「将棋ウォーズ」や、AIを活用したシステム企画・開発を行う、AI企業HEROZの公式テックブログです。

2024-01-19から1日間の記事一覧

日本語LLMの評価についてプロンプトバージョンによる得意不得意を調べてみた