AIの進化が狂気的すぎる。
今週も、業界を揺るがすような驚異的なアップデートが連発されました。
もはや「知らない」では済まされないレベルです。
特に注目すべき、衝撃的なアップデートを10つまとめました🧵
1. Grok Vision
リアルタイムでの画面分析、多言語の音声サポート、そしてリアルタイム検索まで可能に。AIが見ているものをそのまま理解し、応答してくれます。
2. Genspark AI Slides
AIが自動でリサーチを行い、プレゼンテーション資料を作成。ビジュアル生成やドキュメント変換も可能で、資料作成の手間を劇的に削減します。
3. SkyReel V2
無料かつ時間無制限で動画を生成してくれるモデルへとアップデートしました。また、AIが映画を一から作ってくれるAIエージェントも使えます。
4. Dia SoTA speech AI model
Dia 1.6Bモデルは、笑い声や咳払いまで含め、驚くほど豊かな感情表現と自然な話し方を実現。音声AIのレベルを一段引き上げました。
5. Tavus SoTA lipsync model
音声から動画を合成する際のリップシンク(唇の動き)が、驚くほどリアルに。まるで本物の人間が話しているかのような自然さを実現しています。
6. OpenAI gpt-image-1
ChatGPTの強力な画像生成機能が、ついにAPI経由で開発者向けにリリース。これにより、サードパーティアプリへの画像生成AIの組み込みが進みます。
7. ChatGPT Deep Research Mini
ChatGPTの高度なリサーチ機能が、より少ないリソースで利用可能なミニ版として登場。コア機能を維持しつつ、より多くのユーザーがアクセスしやすくなりました。
8. Dreamina AI's Top AI Image (Seedream 3.0)
最大2K解像度のフォトリアルな画像生成に加え、アップスケーリング、インペインティング、拡張、さらには動画生成まで可能な高性能画像AIです。
9. Perplexity Assistant
iOSにも対応し、音声機能が追加。レストラン予約や配車など、複数のアプリを横断したタスクをAIがしてくれるようになりました。
10. PikaffectのIOS対応
動画生成AIモデルのPikaのアプリ内で、オブジェクトを組み合わせた動画生成、あらゆる人物や物を動画に自然に登場させられるPikaffectが使えるようになりました。
この投稿が少しでも参考になったと思った方は、フォロー、いいね、リポストいただけると嬉しいです!引き続き投稿頑張っていきます!
Grok 3のまとめに関しては、こちらから見れますので、ぜひご覧ください!
SkyReel V2に関しては、こちら見れますので、ぜひご覧ください!無料なのはでかいです。
Share this Scrolly Tale with your friends.
A Scrolly Tale is a new way to read Twitter threads with a more visually immersive experience.
Discover more beautiful Scrolly Tales like this.