製品概要
AI多言語会議ツールは、録画済みの会議ファイル(音声・動画)を完全オフラインで解析し、多言語議事録・字幕・話者識別を自動生成する後処理型AIシステムです。国際ビジネスにおける多言語会議の後処理を包括的にDX化し、年間195〜315万円のコスト削減と95%の時間削減を実現します。
従来、多言語会議では通訳費用(年間120〜240万円)、議事録作成時間(週1.5時間)、データ外部送信のセキュリティリスクといった課題がありました。本ツールは完全オフライン動作により、これらの課題をすべて解決します。
主要機能
多言語音声認識
Whisperエンジンにより99言語の音声を高精度にテキスト化。専門用語はカスタム辞書で正確に認識。
419言語間翻訳
MADLAD-400により世界人口の99%以上をカバーする419言語間の任意翻訳に対応。
話者識別
pyannote.audioにより誰が何を発言したかを自動識別。議事録の構造化に貢献。
構造化議事録生成
Llama 3.1により発言内容を要約し、議題・決定事項・アクションアイテムを抽出。
多言語字幕生成
動画に複数言語の字幕を追加。後から会議内容を多言語で確認可能。
合議制による精度向上
同一モデルの異なるサイズ(Large/Medium)による相補処理で誤認識を検出・修正。
技術仕様
| 音声認識 | Whisper(OpenAI)Large/Medium - 99言語対応 |
|---|---|
| 翻訳エンジン | MADLAD-400(Google) - 419言語対応 |
| 話者識別 | pyannote.audio 3.1 - 高精度な話者分離 |
| 議事録生成 | Llama 3.1 70B - 構造化文書生成 |
| 処理方式 | 完全オフライン・後処理型(データ外部送信ゼロ) |
| 合議制システム | シーケンシャル処理による複数モデル協調 |
| ライセンス | すべて商用利用可能(Apache 2.0, MIT, Llama 3.1 Community License) |
価格体系
- 99言語音声認識
- 419言語翻訳
- 話者識別
- 議事録自動生成
- 字幕生成
- カスタム辞書
- 完全オフライン動作
- 個人版の全機能
- 組織向けカスタマイズ
- 専門用語辞書カスタマイズ
- 導入サポート
- 年間メールサポート
- 企業版 Liteの全機能
- Mac Studio M3 Ultra本体込み
- 初期セットアップ代行
- オンサイト導入研修
- 専任サポート(1年間)
- カスタム開発対応
動作環境
| 推奨環境(企業版 Pro) | Mac Studio M3 Ultra(192GB統合メモリ、8TB SSD) |
|---|---|
| 最小動作環境 | Mac Studio M2 Max(64GB統合メモリ、2TB SSD)またはMacBook Pro M4 Max |
| 対応OS | macOS 14.0 (Sonoma) 以降 |
| ネットワーク | 不要(完全オフライン動作) |
| 入力形式 | 音声: MP3, WAV, M4A / 動画: MP4, MOV, MKV |
| 出力形式 | 議事録: Markdown, Word, PDF / 字幕: SRT, VTT |