過日、NHKの関連会社の人の講演をきく機会があって聞いてきた。画面に映し出される字幕を制作している会社の人であった。忙しくてこれからぐんぐん伸びる業界であると自信を持って言っていたので、何か起業を考えてる20代、30代の人がいたら研究してみてはどうだろうか。
私が聞いたのは、NHKのG-Mediaの社員。検索すると業務内容が出てくるはず。パンフのサブコピーが『ライブイベントのコトバを超速でテキスト配信』。一緒に(株)アドバンスト・メディアの『広がる音声認識技術の実際と業務への活用について』という短い説明会もあり、現在日本テレビのスポーツ番組で文字放送化の仕事をしていると言っていた。
音声認識エンジンの開発が進んで、スマホで『○○市○○町○○会社』と持ち主がしゃべれば地図が出てくるが、会議の内容も、音声を認識された一人の人がマイクに向かって『再度、声を出して喋れば数秒で文字で表示される』(リスピークと言う)。実際、講演者がマイクで喋った言葉(講演者の声紋をすでに認識させている)が直ちにスクリーンに文字化して出てくる。この技術を使えば、株主総会やインタビューも、国際会議もそれほどの時差もなくスムースな会議の進行ができるというものだ。
ただ、音声認識の不得手なケースがあって、(1)雑音多い場所やICレコーダーに複数者が同時発言、(2)話し手が支離滅裂・聞き取りにくい(3)話す内容があちこちに飛んで多岐に渡りすぎる、(4)話し手が一気に喋りだす。人工知能とはいえ何でもできるわけではなくて、利用シーンは増えても、人の力・判断力は要として残り、過度の期待はできないという話も出ていた。ここでもアナログあってのデジタル技術の展開である。
実際、会議内容をほぼ時間差なく、ユーチューブなどに流すこともしている。将来はたとえば、サミットも語学変換を通して、直ちに国民の知るところになり、官僚の好きな秘密が軽減されたり、「言った、言わない。記録にあるとか破棄した」などの議論もなくなる。しかし、古い価値観の私は、何でもかんでも、音が記録に残される時代ってどうなんだろうかと不安にも思う。スマホの録音ソフトをONにすれば、夫婦や子どもとの会話も記録に残り、「あのときあなたはああ言った、こう言った」と残されると、かえってお互いの信頼関係が損なわれると思うのだ。
セクハラやパワハラで被害を受けてる人は裁判で使える資料にはなるけれど、日常、ゆるやかな日々を送りたい人にはストレスになると思うのだ。テレビをつけると、必ず画面に文字が打ち込まれている。裏方さんが手作業で入れ込んで、それを画面のどこに貼り付け位置移動をしている職人もいる。何気なく見ているテレビ画面、その後ろに地味な作業を毎日している人がいるという話であった。関心ある方は下記のHPを見るといい。
(株)NHKグローバルメディアサービス
http://info.livetext.jp
(株)アドバンスト・メディア
http://www.advanced-media.co.jp

