• 2017年 5月 29日

内臓だけじゃない!『VocaliD』が声のドナーを募集中

   

Young brothers talking with tin can telephone

自分で声を発することが困難な人が利用する、意思伝達装置。その意思伝達装置に利用する音声の技術に関する研究が、現在すさまじい勢いで進んでいます。

今回はTEDTalksでも紹介された提供者から集められた声のサンプルを元に、新しく合成音声を作成するプロジェクト、『VocaliD』を紹介します。

スポンサーリンク



コンピューターで作られた声

動画はホーキンス博士の講演の様子

「車椅子の物理学者」として知られるスティーヴン・ホーキンス博士。彼も意思伝達装置の利用者の1人ですが、インタビュー動画などで私達が効くことのできる博士の声は、コンピューターでプログラム化された音声です。

重度の言語障害を持つ患者さんは全世界に数多く存在しますが、彼らが意思伝達装置を使って利用できる音声のオプションはごく限られています。彼らは、自身の声だけでなく個性の1つともいえる声の特徴をも、奪われてしまっているのです。

個性を尊重した声の開発

こうした状況を打開し、重度言語障害を持つ人々が自分の体や個性に合った音声を使用できるように、パーソナライズされた合成音声を設計することを目的としたプロジェクト、『VocaliD』がノースイースタン大学のCadlab(Communication Analysis and Design Laboratory )に所属するRupal Patel教授によって立ち上げられました。

Rupal Patel   Profile   TED.com
Rupal Patel教授(参照:TED /https://www.ted.com/profiles/2061757)

このプロジェクトはRupal Patel教授が学生やデラウェアのヌムール/アルフレッドI.デュポン病院、小児聴覚・音声科学研究センターのTim Bunnell博士ととも進めており、ウェブ上やスマートフォンアプリを利用して、クラウドで人々に声の提供を呼びかけ、集めたサンプルを元に、一人ひとりにあった個性的な声を作成しています。

言語障害者が作り出すことのできるわずかな音と、提供された声から作られる合成音声を適応させることで、カスタマイズされた声を作り出します。提供された声は、年齢や性別などにより選別され、できるだけ元々の声音を残しながら、かつ、はっきりと聞き取れるように合成音声がつくられます。

“この研究は、合成音声に頼らずには生きていけない人々が、自分らしく意思を伝えるという点において、大きなインパクトを与えるのではないか”と研究者たちは考えています。全てが同じコンピューターの声はで、全く個性がないといっても過言ではありません。

発声のしくみとその応用

人は、それぞれ異なった声源、つまり喉頭などから起こる振動を持つといわれています。この声源が声道を通り、その他の組織によって形をかえ、子音や母音になります。

言語障害者野の中には、これらのしくみを操作できないだけであって、声源自体は持っている人もいるそうです。パーキンソン病や脳性小児麻痺などの患者は、その人自身の声とドナーの声を元に、カスタマイズされた合成声音を作ることができます。エンジニアが音声認識技術を作り出したように、専門家は提供された数千の文章を使って新しい声を作るのです。

Vocalidでの声の提供には、2~3時間の録音時間がかかります。ドナーは短い分を読み返し、すべての起こり得る英語の音の組み合わせをカバーします。この録音を利用し、専門家たちは声をブレンドし、子音や母音などを作成します。全て作業が終わると、人工音声は録音に含まれていない文章も含めてありとあらゆる文章を話すことができるようになります。新しい声はブレンドされた声なので、ドナーと全く同じ声になるということもありません。

まとめ

科学の進歩による、臓器だけではない、「声」の提供を。声そのものをなくしてしまった人に、新しく、しかも自分の身体固有の要素も含んだ個性のある声が使えるようになることで、患者さんのQOEを高めることのできるプロジェクト『Voiceid』の紹介でした。

これからもTEDTalkなどを中心に、海外の最新医療技術について紹介をしていきたいと思います。

<参照リンク>

<過去のオススメ記事>

スポンサーリンク



最後まで読んでいただきありがとうございます!
よろしければ ↓ より記事のシェアをお願い致します。


Related Posts