ITと哲学と

IT系エンジニアによる技術と哲学のお話。

OpenAI「12 Days of OpenAI」で発表されたAIの進化:その全貌と未来への展望

Geminiで12 Days of OpenAIの内容をレポートしてもらいつつ、ちょっと補足を入れた。

OpenAI「12 Days of OpenAI」で発表されたAIの進化:その全貌と未来への展望

OpenAIは、2024年12月5日から12月16日までの12日間、「12 Days of OpenAI」と題したイベントを開催し、AI技術の進化を象徴するような新製品や機能を次々と発表しました。このイベントは、AI業界に大きな衝撃を与え、今後のAI開発の方向性を示唆するものとなりました。特に、OpenAIは「推論」に焦点を当て、oシリーズモデルでこの分野の限界を押し広げています。本レポートでは、「12 Days of OpenAI」で発表された内容を詳細にまとめ、OpenAIの戦略や今後の展望について考察します。

「12 Days of OpenAI」概要

「12 Days of OpenAI」は、OpenAIが12日間にわたり、毎日新しいAI関連の発表を行うというイベントでした。公式ブログやYouTubeでのライブ配信を通じて、大小さまざまな発表が行われました。CEOのSam Altman氏は、これらの発表を「大きなものと、ちょっとしたプレゼント」と表現し、小さな発表をTwitterで「stocking stuffers(クリスマスの靴下に入れる小さなプレゼント)」と呼んでいました。AIコミュニティは、これらの発表に熱狂し、活発な議論を展開しました。

OpenAIの戦略と今後の展望

「12 Days of OpenAI」で発表された内容は、OpenAIのAI開発における戦略を明確に示しています。それは、 (1) 汎用人工知能 (AGI) の実現(2) AIの安全性確保(3) AIの社会への普及 という3点に集約されます。

1. 汎用人工知能 (AGI) の実現

OpenAIは、o1、o3といった高度な推論能力を持つAIモデルを開発することで、AGIの実現を目指しています。これらのモデルは、従来のAIでは不可能だった複雑なタスクを処理できるようになり、AGIへの道を切り開くものとなります。

2. AIの安全性確保

OpenAIは、AIの安全性確保にも力を入れています。oシリーズモデルでは、安全性仕様を直接教え、それらについて推論する方法を学習させるという、新しいアラインメント戦略を導入しています 3。また、安全性とセキュリティの研究者に、次世代モデルへの早期アクセスを提供することで、安全性の向上に努めています。この早期アクセスプログラムは、厳格な内部安全テスト、外部レッドチーミングサードパーティのテスト機関との協力など、既存のフロンティアモデルテストプロセスを補完するものです。

3. AIの社会への普及

OpenAIは、ChatGPTの様々な機能強化や、Apple Intelligenceとの連携、アプリとの連携などを通じて、AIの社会への普及を促進しています。

「12 Days of OpenAI」は、OpenAIのAI技術に対する強い自信と、AIの未来に対するビジョンを示すものでした。しかし、競合他社であるGoogleも、Gemini-2 Flash ThinkingやVeo 2などの優れたモデルを発表しており 6、競争は激化しています。OpenAIは、今後もAI技術の進化を続け、AGIの実現に向けて邁進していくことが期待されます。

主要発表内容の詳細

1. 推論モデル「o1」の発表とChatGPT Pro(Day 1)

https://www.youtube.com/watch?v=iBfQTnA2n2s

イベント初日に発表されたのは、OpenAI初の推論モデル「o1」でした 1。o1は、従来の言語モデルよりも複雑なタスクを処理できる高度な推論能力を備えています。また、o1-miniと呼ばれる、より軽量でコスト効率の高いバージョンも発表されました。

同時に、月額200ドルのChatGPT Proプランも発表されました。このプランは、OpenAIの最先端モデルとツールへのスケールされたアクセスを提供し、o1、o1-mini、GPT-4o、Advanced Voiceへの無制限のアクセスが含まれています。さらに、より多くの計算能力を使用して、より難しい問題に対してより良い回答を提供するo1 proモードも含まれています。

o1の特徴

Feature Description Citation
コンテキストウィンドウ 128,000トーク 9
構造化出力 JSONスキーマをサポート 10
ツールとの連携 関数と連携可能 10
レイテンシ o1-previewよりも低い 10
責任あるAI 組み込みの安全機能 10
コードの最適化 コードの最適化を提案 11
テストケースの生成 テストケースを生成 11
コードレビューの自動化 コードレビューを自動化 11
ナレッジ共有の促進 ナレッジ共有を促進 11

o1の応用分野

o1は、その高度な推論能力により、様々な分野での活用が期待されています。例えば、医療分野では、患者の症状に基づいて病気を予測したり、適切な医療機関への案内を行うことができます。金融分野では、複雑な金融計算や、ローン金利、投資ポートフォリオ、保険金請求に関する質問に答えることができます。

o1の具体的な使用例

  • 医療: 症状のリストから考えられる病気を予測し、適切な診療科へ案内する。
  • 金融: 変動金利型住宅ローンや保険料の変更に関する複雑な金融計算、ローン金利、投資ポートフォリオ、保険金請求に関する質問に答える。

とはいえ、$200高すぎるんだが?

2. 強化学習による微調整(Day 2)

https://www.youtube.com/watch?v=yCIYS9fx56U

2日目は、強化学習による微調整に関する発表がありました。これは、組織がAIモデルを特定のニーズに合わせてカスタマイズし、パフォーマンスを向上させ、コストを削減できるようにするものです。Azure OpenAI Serviceでは、強化学習による微調整を通じてo1-miniモデルのサポートも導入されました。

3. テキストから動画を生成する「Sora」 (Day 3)

https://www.youtube.com/watch?v=2jKVx2vyZOY

3日目には、テキストから動画を生成するAIモデル「Sora」が発表されました。Soraは、ユーザーのプロンプトに基づいて最大60秒の短いビデオクリップを生成し、既存の短いビデオを拡張することもできます。

以下のラーメンをより美味しそうにしてみた。

こちらが動画

Soraの技術的詳細

Soraは、DALL-E 3の技術を応用した拡散トランスフォーマーであり、以下の特徴を備えています。

  • 動画生成: 3D「パッチ」をノイズ除去することで潜在空間で動画を生成し、ビデオデコンプレッサーによって標準空間に変換します。
  • 再キャプション: ビデオテキストモデルを使用してビデオに詳細なキャプションを作成することで、トレーニングデータを強化します。
  • フレームごとの生成ではない: Soraは、DALL·Eと同じ拡散法を使用し、GPTと同様のトランスフォーマーアーキテクチャを使用して、詳細で複数構成の長いクリップを生成します。
  • 動画全体の同時生成: フレームごとに動画を生成するのではなく、拡散を使用して動画全体を一度に生成します。
  • 未来フレームの予測: 生成された詳細をクリップ全体でほぼ一貫して保持できます。

Soraの機能

  • テキストからの動画生成: テキストの説明に基づいて動画を作成できます。
  • 静止画のアニメーション化: 静止画をアニメーション化できます。
  • 既存の動画のリミックス: 既存の動画を新しい形式にリミックスできます。
  • 動画の拡張: 既存の動画を拡張できます。
  • 動画の時間操作: 動画クリップを時間的に前後に移動させることができます。
  • 画像生成: 動画生成に加えて、画像も生成できます。

Soraの限界

Soraは現実世界を深く理解していますが、オブジェクトの物理的な相互作用を必ずしも正確に反映しているわけではありません。

Soraの潜在的な影響

Soraは、教育ビデオ、マーケティング資料、短編映画の作成など、様々な分野で活用できる可能性を秘めています。動画の作成・消費方法を大きく変え、アニメーションの自動化、パーソナライズされたビデオコンテンツの作成、特殊効果の生成などに貢献する可能性があります。

今年の年末休暇にsoraが使い放題だぜ!

4. キャンバス機能 (Day 4)

https://www.youtube.com/watch?v=qZ0ImE41pVs&t=675s

4日目は、ChatGPTにキャンバス機能が追加されました。これは、ユーザーが視覚的な要素をChatGPTとのやり取りに組み込むことができるようにするものです。

5. Apple Intelligenceとの連携 (Day 5)

https://www.youtube.com/watch?v=mBhkD0iFf4w

5日目は、Apple Intelligenceとの連携が発表されました。これにより、iOS 18.2以降を搭載したiPhoneで、SiriがChatGPTの応答を利用できるようになりました。

6. 高度な音声機能 (Day 6)

https://www.youtube.com/watch?v=NIQDnWlwYyQ

6日目は、高度な音声機能が発表されました。ChatGPTの音声機能に動画生成機能が追加され、季節ごとのインタラクションのためのサンタモードも導入されました。

7. プロジェクト機能 (Day 7)

https://www.youtube.com/watch?v=FcB97h3vrzk&t=25s

7日目は、「プロジェクト」機能がChatGPTに追加されました。これにより、ユーザーはファイルをアップロードし、会話を整理し、ワークフロー管理を改善するためのカスタム手順を設定できるようになりました。

8. ChatGPT Search (Day 8)

https://www.youtube.com/watch?v=OzgNJJ2ErEE

8日目は、ChatGPT Searchが発表されました。これは、Webソースから回答を取得するためのツールで、2024年10月に初めて導入され、速度と関連性のために最適化されました。

9. 開発者向けツール (Day 9)

https://www.youtube.com/watch?v=14leJ1fg4Pw

9日目は、開発者向けのツールが発表されました。リアルタイムAPIの改善や、特殊なAIソリューションを作成するための新しい微調整方法などが含まれます。

WebRTCをサポートしたリアルタイムAPIが改善されたとのこと。低遅延でオーディオストリーミングができるようになった。

https://talibilat.medium.com/title-day-9-of-openais-12-days-of-openai-empowering-developers-with-advanced-tools-and-the-5f5bab6599c5

10. ChatGPTへの電話 (Day 10)

https://www.youtube.com/watch?v=LWa6OHeNK3s

10日目は、ユーザーが指定された電話番号(1-800-CHATGPT)を介してChatGPTに無料で電話できる機能が開始されました。ユーザーは毎月15分間の無料の音声インタラクションを利用できます。

11. アプリとの連携 (Day 11)

https://www.youtube.com/watch?v=g_qxoznfa7E

11日目は、アプリとの連携に焦点が当てられました。ChatGPTが複数のアプリケーションに統合され、シームレスに機能できるようになりました。Macアプリでは、MatLabBBEdit、Novaなどのソフトウェアとの統合がサポートされ 19、テクノロジーから学術界までの業界全体のワークフローが合理化されました。また、Macアプリは、ユーザーの画面上にあるものを表示し、ワークフローを支援する機能も備えています 18。例えば、XcodeWarpでは、いくつかのプログラミング言語でChatGPTに書き込みを支援するように依頼したり、NotesやNotionでは、ChatGPTにメモ書きを支援するように依頼したりすることができます。

12. 推論モデル「o3」のプレビュー (Day 12)

https://www.youtube.com/watch?v=SKBG1sqdyIU&t=2s

最終日には、o1の後継となる推論モデル「o3」のプレビューが公開されました。o3は、プログラミングや数学において「信じられないほど」強力なモデルと呼ばれており 18、o3-miniと呼ばれる、コスト効率の高いバージョンも同時に発表されました。OpenAIによると、o3-miniは推論モデルにおける「コストパフォーマンスのフロンティア」を再定義するものであり、高精度が要求されるがリソースの制約を考慮する必要があるタスクにアクセスできるようにします 2。また、Arc Prize Foundationのプレジデントは、Arc AGIのための新しい最先端スコアを発表しました。これは、従来のAI技術では解くのが難しかったパズルを紹介するものです。

o3とo3-miniの特徴

Feature o3 o3-mini Citation
推論能力 o1よりも高度 高い精度を維持 2
コスト 高い 低い 2
適応型思考時間 - タスクの複雑さに基づいて調整可能 2
推論努力モード - 低、中、高 21
パフォーマンス 高い o1を凌駕 21
高努力モード - o3と同等の性能 20

o3とo3-miniの潜在的な影響

o3とo3-miniは、医療、金融、ソフトウェア開発などの分野に革命を起こす可能性を秘めています。

https://x.com/ren_hongyu/status/1870208580135100750

OpenAI Swarm vs. CrewAI:協調型AIシステムの進化

OpenAI SwarmとCrewAIは、チーム内のすべてのワーカーがAIモデルの集団によって強化され、シームレスに連携し、知識を共有するという、協調型AIシステムの進化を表しています。

倫理的な考慮事項

OpenAIの「12 Days of OpenAI」で発表された技術は、AIの安全性、バイアス、雇用の喪失、AI生成コンテンツの悪用など、倫理的な懸念を引き起こす可能性があります。これらの懸念に対処するために、OpenAIは責任あるAIの開発と利用を促進し、AIの倫理的な影響について透明性のある議論を継続することが重要です。

結論

「12 Days of OpenAI」は、AI技術の進化を象徴するイベントであり、OpenAIの戦略、そしてAIの未来に対するビジョンを示すものでした。AGIの実現、AIの安全性確保、AIの社会への普及という3つの柱を軸に、OpenAIは今後もAI開発をリードしていくことが期待されます。

これらの発表は、AIの展望を大きく変え、様々な分野に革命を起こす可能性を秘めています。同時に、AIの倫理的な影響や、競争の激化といった課題も存在します。OpenAIは、これらの課題に対処しながら、AI技術の進化を続け、人類社会に貢献していくことが求められます。

引用文献

  1. OpenAI o3 and o3-mini—12 Days of OpenAI: Day 12 - YouTube, 12月 22, 2024にアクセス、 https://www.youtube.com/watch?v=SKBG1sqdyIU

  2. OpenAI's O3: Features, O1 Comparison, Release Date & More | DataCamp, 12月 22, 2024にアクセス、 https://www.datacamp.com/blog/o3-openai

  3. 12 Days of OpenAI, 12月 22, 2024にアクセス、 https://openai.com/12-days/

  4. Thoughts on the "12 Days of OpenAI" - Reddit, 12月 22, 2024にアクセス、 https://www.reddit.com/r/OpenAI/comments/1hi32vl/thoughts_on_the_12_days_of_openai/

  5. 12 Days of OpenAI: Day 12 thread - Reddit, 12月 22, 2024にアクセス、 https://www.reddit.com/r/OpenAI/comments/1hipa79/12_days_of_openai_day_12_thread/

  6. Google has overshadowed 12 days of open ai till now! : r/OpenAI - Reddit, 12月 22, 2024にアクセス、 https://www.reddit.com/r/OpenAI/comments/1hgna9l/google_has_overshadowed_12_days_of_open_ai_till/

  7. 12 Days of OpenAI - Release Updates, 12月 22, 2024にアクセス、 https://help.openai.com/en/articles/10271060-12-days-of-openai-release-updates

  8. OpenAI O3: AGI is Finally Here. Imagine a world where artificial… | by Hassan Trabelsi | Dec, 2024 | Medium, 12月 22, 2024にアクセス、 https://medium.com/@hassan.trabelsi/openai-o3-the-agi-is-finally-here-d5951b995682

  9. OpenAI o1 – specifications and technical - Chetty.ai, 12月 22, 2024にアクセス、 https://chetty.ai/post/openai-o1-specifications

  10. Announcing the o1 model in Azure OpenAI Service: Multimodal reasoning with “astounding” analysis, 12月 22, 2024にアクセス、 https://azure.microsoft.com/en-us/blog/announcing-the-o1-model-in-azure-openai-service-multimodal-reasoning-with-astounding-analysis/

  11. OpenAI o1 Guide: How It Works, Use Cases, API & More - DataCamp, 12月 22, 2024にアクセス、 https://www.datacamp.com/blog/open-ai-o1

  12. Meet OpenAI o1: First ChatGPT Model with “Reasoning” Abilities - Kommunicate, 12月 22, 2024にアクセス、 https://www.kommunicate.io/blog/meet-openai-o1/

  13. OpenAI's Sora Text-To-Video Generator: Everything You Need to Know - ThinkML, 12月 22, 2024にアクセス、 https://thinkml.ai/openais-sora-text-to-video-generator-everything-you-need-to-know/

  14. Sora (text-to-video model) - Wikipedia, 12月 22, 2024にアクセス、 https://en.wikipedia.org/wiki/Sora_(text-to-video_model))

  15. What is Sora? OpenAI's text-to-video model - Zapier, 12月 22, 2024にアクセス、 https://zapier.com/blog/sora-ai/

  16. How to use Sora AI - Text To Video Generator by OpenAI - GeeksforGeeks, 12月 22, 2024にアクセス、 https://www.geeksforgeeks.org/how-to-use-sora-video-generating-tool/

  17. Sora: A Deep Dive into OpenAI's Text-to-Video Model | Label Your Data, 12月 22, 2024にアクセス、 https://labelyourdata.com/articles/explaining-openai-sora

  18. 12 Days of OpenAI - Everything that was announced, including ChatGPT, Sora, o1, o3 and more | TechRadar, 12月 22, 2024にアクセス、 https://www.techradar.com/news/live/12-days-of-open-ai-live-blog

  19. OpenAI's “12 Days of OpenAI”: Revolutionizing the AI Landscape | by Julio Pessan | Dec, 2024 | Medium, 12月 22, 2024にアクセス、 https://medium.com/@julio.pessan.pessan/openais-12-days-of-openai-revolutionizing-the-ai-landscape-817a6f2de308

  20. OpenAI unveils new o3 model: What is it and how is it different from o1? | Explained News, 12月 22, 2024にアクセス、 https://indianexpress.com/article/explained/explained-sci-tech/openai-new-o3-model-9737712/

  21. OpenAI o3 and o3 mini: 12 days of OpenAI | by Mehul Gupta | Data Science in your pocket, 12月 22, 2024にアクセス、 https://medium.com/data-science-in-your-pocket/openai-o3-and-o3-mini-12-days-of-openai-6f90cfb3853e