火星财经消息、バブソン学院卒業生のSydney Huangは本日、Human APIのリリースを発表しました。これは、AIシステムが直接人間と協働し、現実世界のデータや労働力を取得できる新しいプラットフォームです。黄はまた、Human APIの背後にある会社Eclipse LabsのCEOも務めています。 「AIインテリジェントエージェントはもはや知能レベルに制限されていません」とSydney Huangは述べています。「彼らが制限されているのは物理的な世界へのアクセスです。Human APIの存在は、そのギャップを埋めることを目的としています。」 Human APIは、企業が称する自律型AIインテリジェントエージェントの「ラストマイル問題」を解決することを目指しています。現代のインテリジェントエージェントは、デジタル環境で推論、計画、タスク実行が可能になっていますが、多くの経済価値のある活動には依然として人間の関与が必要です。例えば、配送の完了、データ収集、API未接続の機関とのやり取りなどです。Human APIは、インテリジェントエージェントに標準化されたインターフェースを提供し、これらの作業を要求、調整し、人間に報酬を支払って完了させることを可能にします。 このプラットフォームは、ローンチ初期には最も制限の多い入力形式の一つである音声データに重点を置いています。音声は情報密度の高いモダリティであり、言語、アクセント、感情、リズム、背景環境などの情報を含みます。しかし、認証制限、圧縮の歪み、メタデータ不足により、高品質でラベル付け可能な音声データの規模的収集は困難です。そのため、多くの音声およびマルチモーダルモデルは、非英語言語、地域のアクセント、バイリンガル音声、重複した会話、微妙な感情表現においてパフォーマンスが低いです。 Human APIは、世界中の貢献者が標準的な消費者向けデバイスを使用して高品質な多言語音声を提供できるようにし、参加のハードルを大幅に下げています。企業は、この方法により、AIシステムが信頼性の高い取得や合成による生成が難しいデータを取得できると述べています。 まだ非公開運営段階にありますが、Human APIはすでに最初の企業向け有料データ提供を完了し、市場の需要を検証しています。一方はより高いカバレッジのデータセットを求めるバイヤー、もう一方はこれらのデータを提供したい貢献者です。 Anagramのパートナーであり、Human APIの投資家であるDavid Feiockは次のように述べています。「AIインテリジェントエージェントは推論において非常に強力ですが、ラストマイルでは依然として課題があります。そこでは調整、データ収集、人間の判断が必要です。Human APIの魅力は、人間の層をインフラとして捉えている点にあります。これはホスティング型サービスや汎用的なクラウドソーシングではなく、インテリジェントエージェント向けの権利保護を重視したシステムであり、人間をシステムに組み込み、即時支払いを実現します。」 Human APIは今後、音声以外の人間提供データ形式や現実世界のタスクの実行へと拡大する予定です。現在、このプラットフォームは thehumanapi.com で貢献者登録を受け付けています。
Sydney Huangは、AIシステムが直接人間を雇用できるようにすることを目的としたエージェント向けのネイティブプラットフォームHuman APIをリリースしました
火星财经消息、バブソン学院卒業生のSydney Huangは本日、Human APIのリリースを発表しました。これは、AIシステムが直接人間と協働し、現実世界のデータや労働力を取得できる新しいプラットフォームです。黄はまた、Human APIの背後にある会社Eclipse LabsのCEOも務めています。 「AIインテリジェントエージェントはもはや知能レベルに制限されていません」とSydney Huangは述べています。「彼らが制限されているのは物理的な世界へのアクセスです。Human APIの存在は、そのギャップを埋めることを目的としています。」 Human APIは、企業が称する自律型AIインテリジェントエージェントの「ラストマイル問題」を解決することを目指しています。現代のインテリジェントエージェントは、デジタル環境で推論、計画、タスク実行が可能になっていますが、多くの経済価値のある活動には依然として人間の関与が必要です。例えば、配送の完了、データ収集、API未接続の機関とのやり取りなどです。Human APIは、インテリジェントエージェントに標準化されたインターフェースを提供し、これらの作業を要求、調整し、人間に報酬を支払って完了させることを可能にします。 このプラットフォームは、ローンチ初期には最も制限の多い入力形式の一つである音声データに重点を置いています。音声は情報密度の高いモダリティであり、言語、アクセント、感情、リズム、背景環境などの情報を含みます。しかし、認証制限、圧縮の歪み、メタデータ不足により、高品質でラベル付け可能な音声データの規模的収集は困難です。そのため、多くの音声およびマルチモーダルモデルは、非英語言語、地域のアクセント、バイリンガル音声、重複した会話、微妙な感情表現においてパフォーマンスが低いです。 Human APIは、世界中の貢献者が標準的な消費者向けデバイスを使用して高品質な多言語音声を提供できるようにし、参加のハードルを大幅に下げています。企業は、この方法により、AIシステムが信頼性の高い取得や合成による生成が難しいデータを取得できると述べています。 まだ非公開運営段階にありますが、Human APIはすでに最初の企業向け有料データ提供を完了し、市場の需要を検証しています。一方はより高いカバレッジのデータセットを求めるバイヤー、もう一方はこれらのデータを提供したい貢献者です。 Anagramのパートナーであり、Human APIの投資家であるDavid Feiockは次のように述べています。「AIインテリジェントエージェントは推論において非常に強力ですが、ラストマイルでは依然として課題があります。そこでは調整、データ収集、人間の判断が必要です。Human APIの魅力は、人間の層をインフラとして捉えている点にあります。これはホスティング型サービスや汎用的なクラウドソーシングではなく、インテリジェントエージェント向けの権利保護を重視したシステムであり、人間をシステムに組み込み、即時支払いを実現します。」 Human APIは今後、音声以外の人間提供データ形式や現実世界のタスクの実行へと拡大する予定です。現在、このプラットフォームは thehumanapi.com で貢献者登録を受け付けています。