株式会社Elith製薬業界における高性能な音声認識モデル PHASRの開発
製薬業界における高性能な音声認識モデル PHASRの開発に成功しました。
我々は、業界のニーズに合わせて設計された独自の製薬ドメイン音声データセット約10時間分を収集し、これを基にESPnetの音声認識レシピを用いて、製薬分野に特化した音声認識モデルを構築しました。
製薬ドメインにおいて、本モデルとCPUで動く一般的な音声認識モデル(Whisper medium、small、base、tiny)との比較実験を行いました。
テストには、製薬関連の30発話を用い、文字誤り率(CER)を評価指標としました。これにより、実際の製薬業務での利用において、各モデルの性能を客観的に評価しました。
……
続きがあります