Excel ファイルを利用して日本語の QnA ペアを追加する際の注意事項についてご紹介します。
Excel ファイルを利用した場合の注意事項
Excel ファイルを利用して日本語の漢字を含める質問と回答を登録する際に、以下の図のように、登録された質問と回答の末尾に漢字のふりがなが付いていることがあります。
また、上記の図では、Excel ファイルの 「Prompts」 列に入っている、漢字を含める内容がマルチターンの Prompts として反映されていません。
この事象の原因としては、Excel 上で漢字を入力した際に自動的に付加されたふりがな (ルビ) が QnA Maker によって抽出されたためと想定されます。
シート データを並べ替える場合、日本語データは既定でふりがなによって並べ替えられます。 正しいふりがながそれらを使用する文字に使用されている場合、日本語の用語は、国語辞書に現れるのと同じ順序で並べ替えられます。
(中略)
ふりがなを日本語版の Excel で表示し、漢字 (日本語で使用される漢字) を入力すると、Excel はふりがなを自動的にガイドに追加します。
これは以下の図のように、Excel 上で漢字のふりがなを表示することで確認できます。
現状 QnA Maker は Excel のふりがなも抽出するため、Excel が自動的に付与したふりがなを削除しない状態で、QnA Maker ポータルの [+Add file] もしくは [Import knowledge base] の機能で QnA ペアを追加した場合は、漢字のふりがなも質問と回答に含まれます。
対処策としては、Excel ファイルからふりがなを削除することになりますが、以下の図ように、ふりがなを含むセルをコピーして別のセルへ「数式」として貼り付けると、ふりがなの部分はコピーされませんので、一括削除のアイデアとしてご参考ください。
上記のように、ふりがなを削除した状態の Excel ファイルを利用して質問と回答を追加した場合は、以下の通り漢字のふりがなは表示されません。また、Excel の「Prompts」列の内容もマルチターンの Prompts として反映されるようになります。
変更履歴
2021/02/03 created by Chao
2024/05/20 modified by Uehara