出典:gooニュース
AIの「マルチモーダル」ってなんだろう? グーグルやOpenAIが大騒ぎしてる理由
また、ソフトだけでなく、マルチモーダルを乗せたハードも注目したいところ。現時点ではモノとして酷評されていますが、Humane AIやRabbit R1もマルチモーダルが可能にしたガジェットです。
Microsoft、マルチモーダルなSLM「Phi-3-vision」をプレビュー
画像を解析するマルチモーダルなSLMだ。プレビュー版を利用可能。 SLMは単純なタスクで適切に実行できるように設計されており、リソースが限られる組織や端末上でローカルに実行する必要があるアプリに適した言語モデルだ。 visionは、描画はできないが、モバイル端末で利用可能なコンパクトさだ。
もっと調べる