Blog Layout

第 4 世代の AI 翻訳は先祖返りなのか?

Hideo Yanagi • Jan 05, 2024

Google Translate (NMT) を第 3 世代とするなら、大規模言語モデル (LLM) を土台とする AI 翻訳は、第 4 世代と言えるだろう。


第 4 世代の特徴は、第 3 世代と比べて、「用語」や「フレーズ」の翻訳の仕方の(ある種の)ルールを簡単に学習させることができることと言える。


その点で第 4 世代は、第 1 世代(ルールベース)の機械翻訳ととても似ている。


第 3 世代も、用語集の機能があったり、Google Translate であれば AutoML といった転移学習の手法はあって、自社好みにチューニングすることができたが、あまりに副作用が強すぎて、訳出品質の劣化につながることもしばしばあった。用語集の機能は名詞にしか使えず、転移学習 (AutoML) の手法も煩雑にすぎた。そして、効果があるとは言いづらかった。


第 4 世代では、用語やフレーズの翻訳の仕方のルールをシステムに登録すればよいのだが、大規模言語モデルを土台にしているから、人間に対して指示を出すときと同じ形でルールを規定できる。


たとえば、「製品」を「product」と翻訳したいとする。これを辞書に登録するわけだが、第 3 世代では、訳語の「product」は文字列として固定されてしまって、複数形の活用もされないし、見出しのときに「Product」とキャピタライズされることもない。第 4 世代では、必要な活用形の処理を行ってくれる。


第 4 世代は、翻訳者個人のレベルで AI 翻訳を育てていくことができるようになった。第 1 世代のルールベースの機械翻訳では、個人の翻訳者が機械翻訳ソフトウェアを購入して、個人がコツコツ辞書登録をして、機械翻訳の結果を育てていた(それは労多くして実り少ない不毛な努力であったが)。第 4 世代でも同じことができる。


第 4 世代では、用語集も登録できるし、過去の翻訳資産である翻訳メモリー (TM) を登録することもできる。フレーズレベルの訳し方を登録することもできる。そして、ベースの翻訳品質自体がかなり良い。副作用もなく機械翻訳を成長させることができる。


機械翻訳・AI 翻訳の世代交代はだいたい 10 年ごとに起きる。10 年後には第 5 世代が登場するのだろうし、それがどんな姿なのかまったく想像がつかない。


しかし、これからの 10 年は間違いなく第 4 世代の AI 翻訳が中心になる。




By Takao Tanaka 17 Apr, 2024
自治体関連用語を多言語で集積し「自治体言語資産データベース」として公開。どなたでも自由に閲覧できます。
By Takao Tanaka 11 Mar, 2024
Webサイト自動多言語化ソリューションCistate Translation Proxy が国際非開削技術協会 (The International Society for Trenchless Technology、以下ISTT) のWebサイトに導入されました。同協会のWebサイトの内容は英語から日本語、スペイン語、ドイツ語、ポルトガル語へと翻訳され、各国の技術者へと届けられます。
By Takao Tanaka 31 Jan, 2024
Webサイト自動多言語化ソリューションCistate Translation Proxy を『令和6年能登半島地震 支援情報ナビ』へ無償提供。多言語での支援情報の発信をサポートします。
By Hideo Yanagi 21 Dec, 2023
2023 年 10 月 1 日、オペレーションオフィスを恵比寿ガーデンプレイスからいちご恵比寿グリーングラス6F に移転いたしました。
By Hideo Yanagi 21 Dec, 2023
株式会社システートソリューションズの Web サイトをリニューアルいたしました。テーマは「異次元の AI 翻訳」「第 4 世代の AI 翻訳」。
By Takao Tanaka 04 Dec, 2023
経済産業省関東経済産業局は、地域のサービス事業者の労働生産性の向上・競争力強化に向けた取組を強力に推進するため広域関東圏での支援ネットワークSISC Kanto(Service Industry Support Consortium in Kanto)を立ち上げ、Cistate Translation Proxy は多言語コンテンツの運用を支援するソリューションとしてSISC Kantoに登録されました。
By Takao Tanaka 07 Jul, 2023
JリーグのFC東京(東京フットボール株式会社)が当社の多言語化ソリューション「Cistate Translation Proxy」を導入し、英語版ウェブサイトを公開しました。英語版サイトを通して、海外からの旅行客および国内在住の外国人向けにリアルタイム、かつ効率的な情報発信を実現します。 FC東京: https://www.fctokyo.co.jp/en/
By Hideo Yanagi 19 Apr, 2023
東京都稲城市 (市長: 高橋 勝浩) は市内在住の外国人向けに情報発信を強化するため、2023年4月1日より株式会社システート ソリューションズ (本社: 東京都渋谷区恵比寿、代表者: 柳 英夫) が提供するホームページ自動多言語化ソリューション『Cistate Translation Proxy (システート トランスレーション プロキシ)』を市公式ホームページに導入し、多言語での情報発信を強化しました。
More Posts
Share by: