この度、株式会社バオバブは、生成AIモデルの出力に対し、客観性と透明性の高い第三者評価(Human Evaluation)を提供する新サービス『BAO-VAL(バオバル)』の提供を開始いたしました。

本サービスは、自社モデルの検証や他社モデルとの比較を行う際に課題となりやすい「内部評価のバイアス」を排除し、論文発表やPR、社内報告などに確かな根拠となる「客観的なエビデンス」を提供するものです。
バオバブは、15年以上にわたり培ってきたアノテーション・データ構築のノウハウを活かし、厳格な評価ガイドラインの策定からお客様と伴走することで、評価のブラックボックス化を防ぎ、AIモデルの弱点分析と改善を強力にサポートしてまいります。
私たちは、客観的で信頼性の高い評価を通じてAI開発の基盤を支え、より良いAIの実用化とイノベーション創出に貢献できることを楽しみにしております。また、本サービスの提供開始にあわせ、実際の「評価データセット」と「評価ガイドライン」の一部を無料公開いたしましたので、ぜひご覧ください。
◆サービスページ:https://baobab-trees.com/service/llm
◆プレスリリース:https://prtimes.jp/main/html/rd/p/000000006.000112000.html