Excel ファイルを利用して日本語の QnA ペアを追加する際の注意事項についてご紹介します。
Excel ファイルを利用した場合の注意事項
Excel ファイルを利用して日本語の漢字を含める質問と回答を登録する際に、以下の図のように、登録された質問と回答の末尾に漢字のふりがなが付いていることがあります。
また、上記の図では、Excel ファイルの 「Prompts」 列に入っている、漢字を含める内容がマルチターンの Prompts として反映されていません。
この事象の原因としては、Excel 上で漢字を入力した際に自動的に付加されたふりがな (ルビ) が QnA Maker によって抽出されたためと想定されます。
日本語データを入力するために使用された発音文字の文字列は、ルビを適用するために使用されます。
シートのデータを並べ替えると、既定では、日本語データはふりがなによって並べ替えられます。
(中略)
Excel の日本語バージョンでふりがなを表示し、漢字 (日本語の言語で使用される中国語の文字) を入力すると、自動的にルビ記号がガイドに追加されます。
これは以下の図のように、Excel 上で漢字のふりがなを表示することで確認できます。
現状 QnA Maker は Excel のふりがなも抽出するため、Excel が自動的に付与したふりがなを削除しない状態で、QnA Maker ポータルの [+Add file] もしくは [Import knowledge base] の機能で QnA ペアを追加した場合は、漢字のふりがなも質問と回答に含まれます。
対処策としては、Excel ファイルからふりがなを削除することになりますが、以下の図ように、ふりがなを含むセルをコピーして別のセルへ「数式」として貼り付けると、ふりがなの部分はコピーされませんので、一括削除のアイデアとしてご参考ください。
上記のように、ふりがなを削除した状態の Excel ファイルを利用して質問と回答を追加した場合は、以下の通り漢字のふりがなは表示されません。また、Excel の「Prompts」列の内容もマルチターンの Prompts として反映されるようになります。
変更履歴
2021/02/03 created by Chao