はじめる前に
- 必須AWS アカウントを持っていること
- 必須マネジメントコンソールにサインインできること
※ このハンズオンは すべてコンソールだけで完結します。コマンドラインや SSH などの操作、サーバーの準備は一切ありません。
参照する公式ドキュメント
手順に迷ったときや、用語の意味を確かめたいときに開きましょう。
※ リンク切れの場合は、ページタイトルで検索してください。
背景・シナリオ
海外向けのサービスを作るときや、外国語の文章を素早く理解したいとき、毎回人の手で翻訳するのは時間がかかります。Amazon Translate は、文章を渡すだけで翻訳結果を返してくれる機械翻訳サービスです。
今回は、コンソールに用意されている「リアルタイム翻訳」の画面を使い、日本語の文章をその場で別の言語に翻訳してみます。モデルの学習や、事前の準備は必要ありません。
翻訳の精度はどれくらい信頼できるの?
機械翻訳なので完璧ではありませんが、文章の大意をすばやく把握したり、下訳として使ったりするには十分な精度です。重要な文書や、誤解が許されない場面では、人による確認も合わせるのがおすすめです。
対応している言語はどれくらいあるの?
数十以上の言語に対応しています。対応言語の一覧は、上記の公式ドキュメントで確認できます。今回は例として、日本語から英語への翻訳を試します。
コンソールのリアルタイム翻訳機能で、日本語の文章を別の言語に翻訳し、結果を確認する。さらに翻訳元言語を「自動検出」にした場合や、翻訳先言語を変えた場合の動きも確認する。
つくる構成
サーバーやリソースを作る作業はありません。コンソールの入力欄に文章を入れると、その場で翻訳結果が表示される、というシンプルな流れです。
入力と出力の例
要件
以下の要件を満たし、リアルタイム翻訳の基本的な使い方を確認してください。
| No | 要件 |
|---|---|
| 1 | Amazon Translate が利用可能なリージョンを使用する(例:「アジアパシフィック(東京)ap-northeast-1」)。 |
| 2 | コンソールの「リアルタイム翻訳」に、日本語の文章を自由に入力し、英語に翻訳する。 |
| 3 | 翻訳元言語の指定を「自動検出」に変更し、同じ文章で結果を確認する。 |
| 4 | 翻訳先言語を別の言語(例:中国語、韓国語など)に変更し、結果を比較する。 |
構築の進め方
「文章を入れる → 結果を見る → 設定を変えて比べる」という、シンプルな流れです。
-
マネジメントコンソールにサインインし、リージョンを確認する
ブラウザで AWS マネジメントコンソールにサインインします。画面右上のリージョンが、Amazon Translate が利用可能なリージョン(例:「アジアパシフィック(東京)ap-northeast-1」)になっていることを確認します。
提供リージョンに注意Amazon Translate は、すべてのリージョンで使えるわけではありません。利用できないリージョンを選んでいる場合、コンソールにメニューが表示されないことがあります。
-
Translate コンソールを開く
画面上部の検索バーに
Translateと入力し、Amazon Translate のコンソールを開きます。左メニューの「リアルタイム翻訳」を選びます。 -
日本語の文章を英語に翻訳する
翻訳元言語を「日本語」、翻訳先言語を「英語」に設定し、左側の入力欄に自由な日本語の文章を入力します。右側に翻訳結果が表示されます。
-
翻訳元言語を「自動検出」に変更する
翻訳元言語のプルダウンを「言語を自動検出」に変更し、同じ文章をもう一度入力(または再入力)して、結果が変わらないことを確認します。
自動検出は文章から言語を推測する機能「自動検出」を選ぶと、入力した文章そのものから言語を推測します。日本語として自然な文章であれば、固定で「日本語」を指定したときと同じ結果になるはずです。
-
翻訳先言語を変えて結果を比較する
翻訳先言語を、英語以外の言語(例:中国語、韓国語など)に変更し、同じ日本語の文章がどのように翻訳されるかを見比べます。
つまずきポイント
初学者がよく引っかかる箇所を先回りでまとめました。答えそのものは載せていませんが、「どこを見直せばよいか」の手がかりとして使ってください。
「コンソールを開いても、リアルタイム翻訳の画面が見当たらない」
選んでいるリージョンが、Amazon Translate の提供リージョンに含まれているか見直しましょう。提供リージョン外を選んでいると、機能の一部が使えなかったり、表示が変わったりすることがあります。
「自動検出にしたら、想定していない言語だと判定された」
入力した文章が極端に短い、あるいは複数の言語が混ざっていないか見直してみましょう。自動検出は文章の内容から言語を推測する仕組みのため、判定に使える情報が少ないと、結果が不安定になることがあります。
完了チェック
要件の再確認ではなく、画面のどこを見れば達成を確認できるかをまとめました。Translate コンソールを開いて、次を順に確かめましょう。
- 入力した日本語の文章に対して、右側に英語の翻訳結果が表示されている。
- 翻訳元言語を「自動検出」に変更しても、同様の翻訳結果が得られる。
- 翻訳先言語を変更すると、表示される翻訳結果も変わる。
考えてみよう
手を動かすことに加えて、次の問いに自分の言葉で答えられるようにしておくと、理解がより深まります。
- 機械翻訳が向いている場面と、人による翻訳が必要な場面の違いはどこにあるでしょうか。
ヒント
大まかな意味を素早く知りたい場面と、契約書や医療文書のように 1 文字の間違いも許されない場面を比べてみましょう。速さと正確さ、どちらを優先するかという観点がヒントです。 - 同じ日本語の文章でも、翻訳先の言語によって訳の質に差が出ることがあります。これはなぜだと考えられるでしょうか。
ヒント
機械翻訳は、大量の翻訳済みの文章データから学習しています。言語の組み合わせによって、学習に使えるデータの量や質に差があるとすれば、結果にどう影響しそうか考えてみましょう。 - 今回はコンソールに文章を貼り付けて結果を見ましたが、これを実際のアプリケーションに組み込むとしたら、どのような仕組みが必要になりそうでしょうか。
ヒント
コンソールでの操作は、人が画面を見て入力するためのものです。アプリケーションから自動で呼び出すには、プログラムから直接サービスを呼び出す仕組みが必要になります。その呼び出し方の名前を調べてみましょう。
後片づけ
今回はコンソール上で文章を入力して結果を見るだけの内容で、新しいリソースは作成していません。削除すべき操作は特にありません。
- 特別な後片づけは不要:リアルタイム翻訳の画面に入力した文章や結果は、画面を離れると保存されません。バケットやインスタンスのような、削除を忘れると課金が続くリソースは作成していません。
コストに関する注意: Amazon Translate は、翻訳した文字数に応じた料金がかかります。今回のような少量のテスト翻訳であれば、無料利用枠の対象になる場合があります(無料利用枠の詳細な範囲は AWS の公式料金ページで確認してください)。今回の操作では、削除が必要な持続的なリソースは作成していないため、追加の片づけによる課金回避の手順はありません。