バオバブが目指す社会
誰もがその人らしくいることが
受け入れられ、
人生の選択肢が
開かれている社会へ
私たちは、働くことに制限がある人も、そうでない人も、互いに違いを認め合い共助する文化を何よりも尊重しています。
働くことを通じて、「それぞれ1人ひとりが自己有用感を高く持ち、適正な対価を得られる環境と文化をつくること」、そして、「それぞれ異なる背景や事情を持っていても、誰もがプロフェッショナルとしてプロジェクトに向き合える仕組みを作り、人材を育成し続けること」を大切にしています。
それは自分で選択・決定し、自分で行動する人が社会に増えることが、不平・不満を家庭、パートナー、会社、地域、そして、国や国籍のせいにすることなく、誰もがみな幸せになることにつながると信じているからです。
1人ひとりがアノテーションのプロとして働くバオバブの文化と仕組みで、私たちは、世界最高品質のAI学習データを提供して参ります。
バオバブのサービス
世界最高品質のAI学習データを提供
人工知能開発の成功には、質の高い学習データが不可欠です。アノテーションプロフェッショナルの育成と独自のツール開発、そして徹底した品質管理で、高品質なAI(人工知能)学習データをスピーディーに提供しています。
LLM開発/ファインチューニング用データセット構築/RLHF/モデル評価
自然言語のAI開発に関する豊富な実績と見識を持つ専門家による大規模言語モデル(Large Language Models、LLM)の開発、モデルの精度を高めるのに不可欠なファインチューニング用のデータセット構築、AIのパフォーマンスを最大限に引き出すRLHF(Reinforcement Learning from Human Feedback)、及びモデルの評価まで一貫して承ります。
画像アノテーション/音声書き起こし
2015年以来、バウンディングボックス(Bounding Box)、 ポリゴン(Polygon)、セマンティック セグメンテーション(Semantic Segmentation)、キーポイント付与(Keypoint)、動画へのアノテーション、そして動画や静止画へのキャプション付与などマルチモーダル分野向けも多数承っております。また、アノテーションのみならずモデルの学習・評価まで実施し、データの改善につなげる評価レポートサービス「Baobab AutoML Vision Report」サービスも併せてご提供可能です。
音声書き起こし/アノテーション
ELAN等にて音声をテキストに書き起こし/ タグ付け
日本語のみならず英語・中国語など多言語も承ります。
テキストアノテーション
タグ付け / 分類/ 固有名詞抽出など
機械翻訳用学習データ構築
創業以来、数百万文字規模のプロジェクトを中心に研究機関や大学に機械翻訳のため学習データ(対訳)をどこよりも速くリーズナブルな価格で提供してきました。
多言語対訳シナリオ作成
ご要望に沿った設定・対話シナリオを元に、ネイティブによる読み上げ音声データの作成、2人の話者が自由な発話表現で対話を行う模擬会話、書き起こしテキストなどを指定された形式でご納品します。
画像収集 / 音声収集
自社開発したモバイルアプリツール「moringa」を使って、世界中のパートナーが画像収集、他言語発話音声や雑音収集を行います。
クライアントボイス
-
Preferred Networks 代表取締役副社長
岡野原 大輔
「高クオリティで様々な要求に応じた画像アノテーションデータ・セットを作成していただいております。またアノテーターも一人ひとり管理されているため、機密性が高いデータのアノテーションもお願いしております。」
-
カーネギーメロン大学 言語技術研究所(CMU-LTI) 准教授
Graham Neubig
「バオバブに研究用のデータ作成を何回も頼んでいますが、少し変わった依頼でも快く、柔軟に対応していただき、大変助かっています。ぜひおすすめします。」