RION-JPN-vol15
6/24

bfold =Wfold =・・・・・・+εε· 4 γ+√ σ 2計算量削減2つの層での計算を事前に合体させておくγ+√ σ 2入力全結合層BatchNormalization層入力全結合層BatchNormalization層y = Wfoldx + bfold(b – μ) + βz – μ+√ σ 2εβ+· W ,初期伝達関数測定でハウリングを抑制z = Wx + by = γ· DNN が入力音を分析数式の簡略化によって計算量を削減計算量やメモリなどの容量に制限がある補聴器で AI 機能を実現するために用いた技術の1つが、「Batch Normalization Folding」という手法。異なる2つの層で行う計算を前もって数式的に合体させておくことで、1層分の計算量やパラメータをゼロにすることができる。AI NR 機能のイメージ補聴器に入ってきた、人の声と雑音が混ざった音を、AI の機械学習モデルであるDNN(ディープニューラルネットワーク)が分析。瞬時に雑音のみを抑え、AI NR が自然な音を耳に届ける。突発的な音や衝撃音などの抑制に性能を発揮する。変更後AI NR が決定した音のバランス赤:音を維持、青:音を抑制本来の計算入力音:人の声 + 雑音 一方で、製品化に向けては大きなハードルがあることも、佐藤は予め分かっていた。能が出るものですが、補聴器では計算量が少なくメモリをあまり使わないものが要求されるので、高性能の AIをそのまま搭載することはできません。またDSPで効率的に計算できるかどうかという制約もあり、それらを総合的に考慮する必要がありました」 課題は大きく2つ。1 つ目は補聴器内部メモリの容量が少ないこと。2 つ目は計算量に制約があることだ。雑音を抑制するためには、1 回の計算をわずか3 ms( 0.003 秒)で終えなくてはならない。シミュレーションを行うパソコンの端末では AI NR が持つ力を余すことなく発揮できても、補聴器のサイズで実現しようとすると計算速度が追い付かなくなってしまう。「どういう工夫ができるかを模索して、数式的な計算の効率化を考えました。それをDSP の計算を行う部分に実装。同じ処理でも計算量を少なくなるようにしたのです。そうした改善を地道に続けて、計算効率を上げ、小さなメモリでも性能を高めることができました。」 雑音の抑制と同時に、補聴器を快適に装用する上で大切なことはハウリングが起こらないことだ。ハウリングとは補聴器と耳の隙間から漏れ出た音がマイクに入り、増幅が繰り返されて発生する異音(ピーピー音)のこと。ユーザーにとって不快な音で、補聴器装用のモチベーションを下げる要因になる。新たな補聴器の開発にあたり、このハウリングを抑制するハウリングキャンセラーという機能に対応したのが、湯野悠希だ。「ハウリングキャンセラーの難しい点は、さまざまな音環境に対応しなければならないところです。シミュレーション上で確認できる範囲は限られるので、雑音の種類を準備したとしてもどういった環境で音を聞いているか、その反射などの具合によってもフィードバックの経路は変わってしまいます。実装したものが対応できるかどうかを繰り返し確かめる過程に、根気強さが必要でした」 ハウリングを起こさないための主な手法として“ 入力された信号に逆位相の信号を加えてハウリングを抑える方式 ”や“ 周波数をずらしてハウリングを抑える方式 ” がある。前機種のリオネットシリーズでもそれらの手法を採用していたが、少なからず音質の劣化や異音の発生が確認されていた。そこで今回、湯野が改良手段として取り組んだのは、初期伝達関数測定を採り入れることだ。ここでの初期伝達関数とは、ユーザーが補聴器を装用した状態で、補聴器のイヤホンから出た音がマイクに入るまでの経路の周波数特性のこと。この特性を 「 AI は基本的に計算量が大きいほど性

元のページ  ../index.html#6

このブックを見る