マルチモーダル
文章だけでなく、画像、音声、動画、表などを組み合わせて扱えるAIのことです。
意味
マルチモーダルAIは、文章、画像、音声、動画、表など複数形式の情報を入力または出力として扱えるAIです。
中小企業で気にする理由
現場の情報は文章だけではありません。写真、録音、PDF、画面キャプチャを扱えると便利ですが、個人情報や専門判断のリスクも増えます。
業務での影響
ECの商品画像、会議音声、採用資料、営業資料、社内マニュアルのスクリーンショットなどをAIで扱いやすくなります。
回避手順
画像や音声に含まれる個人情報を確認し、AIに判断してよい範囲を指定します。公開前の文言、診断、契約判断は人が確認します。
関連例
OpenAI、Google Gemini、Adobe Firefly、Microsoft Designerなどの公式説明が参考になります。業務では素材管理と確認者の設定が重要です。