Google音声文字変換のポテンシャル

記事内で紹介する商品を購入することで、当サイトに売り上げの一部が還元されることがあります。

仕事効率化

日本の企業でGAFAMが使いこなせないと生きていけないと一層感じるようになったこの頃です。

おっさんたちよ、ドンマイ!

こんにちは、制作ディレクターのくらゆーです。

Googleから出ているアプリで「音声文字変換」というのがあるのですが、これがとても優れもの!僕が知ったのは落合陽一さんのtweetです。

tweetでは動画が貼り付けられていて話す落合さんに合わせて同じ画面上にテキストが表示され、話すごとに上に流れていくのを見て、めっちゃおもしろい!と感じたんです。だからなんとしてもあの感じを再現したいと思ったのがきっかけです。

ビデオスイッチャーを使って重ねているらしかったのですが、スイッチャーなんてすぐ買えない。

そこで取り急ぎ思い付いたのが、手元にタブレットを持って一緒に映るという作戦。はい、つまりこんな感じ。

ダサい感は否めませんが(笑)、純粋にこの音声文字変換のアプリの機能としての凄さは伝わりやすいはず。

これで本来事足りるはずなんですが、この時ばかりは僕も欲深くなってしまいましたね。

んーなんとしてもテキストを重ねて主画面と合成したい…。

でも、ちょっと考えたんですが、再現するだけならなにもライブ配信でなくたって構わないのだからビデオスイッチャーなんていらなくないか?と。

アプリを起動している画面自体を録画して、そのファイルをクロマキーして抜けばイケそうって思った。(別に斬新でもなんでもなく普通の発想。)

思ったら即効やるのがくらゆー。それをやったのがこちら。

少し使ってみてわかった長所は、

長所

①言葉の認識精度が高い
②変換が速く、動きがスムーズ。喋るスピードに追い付いている。
③ノイズ(音楽、風、子供の泣き声など)の聞き分けが自動でされ、喋り主のテキストと混ざらない
④表示がシンプル
⑤文字変換されたテキストは全てコピーできる


一方で短所は、

短所

①フォントは選べない
②さすがに滑舌よく話さないと誤認識される

くらいでしょうか。

話し手にも課題は残りますが、かなり可能性のあるアプリだと思います。

話すのを生業にしてる人や話すだけでコンテンツになるような人(ほんと羨ましいけど)は、鬼に金棒と言わんばかりに強力な助っ人になること間違いないです。

文字起こしってめっちゃ時間食いますからね。

ではでは、僕も頑張ります!

コメント

タイトルとURLをコピーしました