Talking New York --- 発見と感動を見つける英語

発見と感動を与えてくれるニューヨークを英語学習に役立つコンテンツにして毎日お届けしています。

これが生成A.I.の限界か?ウォールストリート・ジャーナルの読み方。

生成A.I.が華々しく登場し、私たちの生活が大きく変わる予感を与えています。そこには良い面と悪い面があり、期待と同時に不安も存在します。


A.I.についてのウォールストリート・ジャーナル(The Wallstreet Journal)の記事を取り上げます。(2024年5月31日付、クリストファー・ミルズ記者によるものです。原文はこちらです。)


ウォールストリート・ジャーナルの記事は、かなり専門的な項目を深掘りしているので、ある程度、前知識をもって読むことが必要です。大見出しや、小見出しをみると、書いてある内容が予測できることがあります。また自分の考えと比較しながら読めるかもしれません。


今日のリーディングは、自分がすでに持っている知識を助けにしながら、内容を予測して読み進めるというスタイルです。


ということで、今日のリーディングのポイントは、



★小見出しを参考に、内容を予測しながら、その答えを探す


です。


まずは、今日扱う記事のタイトルです。


The AI Revolution Is Already Losing Steam

The pace of innovation in AI is slowing, its usefulness(有用性) is limited, and the cost of running it remains exorbitant(法外な)

By

Christopher Mims

May 31, 2024


AI革命はすでに勢いを失いつつある
AIの技術革新のペースは速度を落としてきており、その有用性は限られ、その運用コストは法外に高いままだ
クリストファー・ミムズ
2024年5月31日


本文に次のような小見出しが付いていますので、それを読んでこれから読む内容の予測をします。


The pace of improvement in AIs is slowing
AIを改良するペースが落ちている


👩‍💻内容の予測


● 生成AIの「改良」がどういうことかについて書いてあるだろう。


● 改良を重ねた結果、どんなことが起こって来るのかが書いてあるだろう。


Most of the measurable(測定可能) and qualitative(質的な) improvements in today’s large language model AIs like OpenAI’s ChatGPT and Google’s Gemini—including their talents for writing and analysis—come down to shoving (押し込む)ever more data into them.


These models work by digesting (消化する)huge volumes of text, and it’s undeniable(否定できない) that up to now, simply adding more has led to better capabilities. But a major barrier to continuing down this path is that companies have already trained their AIs on more or less (多かれ少なかれ)the entire internet, and are running out of (なくなりつつある)additional data to hoover up(掃除機の様に吸い込む). There aren’t 10 more internets’ worth of human-generated content for today’s AIs to inhale.


オープンAIのチャットGPTやグーグルのジェミニのような、今日の大規模言語モデルのAI---その文章を書いたり分析したりする能力を含め---の測定可能な質的改良は、結局、今以上に多くのデータを押し込むということでしかない。


これらのモデルは、膨大な量のテキストを消化することで機能するため、今のところ、単純にデータを追加すれば、性能はより優れたものになることは否定できない。しかし、こういう方向で進んでいくと突き当たってしまう大きな障壁は、企業が既に多かれ少なかれ全インターネット上でAIの力を鍛えてきており、吸い込む追加データがなくなりつつあるということだ。現在のAIがとりこめる人間が作ったコンテンツはあと10インターネット分もないのだ。


("hoover up"の"hoover"は、もともと電気掃除機の商品名だったようです。)



👩‍💻この先に書いてある内容の予測


● 「吸い込むデータ」がなくなったら、次にできることは何かということが書いてあるだろう。
● 著者のAIの改良についてのまとめになる部分があるだろう。


To train next generation AIs, engineers are turning to “synthetic data,”(合成データ) which is data generated by other AIs. That approach didn’t work to create better self-driving technology for vehicles, and there is plenty of evidence it will be no better for large language models, says Gary Marcus, a cognitive scientist who sold an AI startup to Uber in 2016.


AIs like ChatGPT rapidly got better in their early days, but what we’ve seen in the past 14-and-a-half months are only incremental (斬新的な)gains, says Marcus. “The truth is, the core capabilities of these systems have either reached a plateau(横ばい), or at least have slowed down in their improvement,” he adds.





次世代のAIを訓練するために、エンジニアたちは「合成データ」に目を向けている。「合成データ」というのは、他のAIによって作成されたデータのことである。2016年にウーバーにAIスタートアップを売却した認知科学者であるゲイリー・マーカスは、そのやり方を用いても自動運転技術は向上しなかったし、大規模な言語モデルにとっても今まで以上に良い方法にはならないだろういう証拠がたくさんある、と言う。


彼が続けて言うには、チャットGPTのようなAIは、初期には急速に改良されたが、この14ヶ月半で我々が目にしたものは、漸進的な進歩に過ぎず、「実際のところ、これらのシステムの中核となる能力は横ばいとなっているか、少なくとも向上の速度が鈍っているかだ」ということだ。


 
👩生成AIを使って「事務を合理化した」、「世論調査をまとめて政策提言に生かした」、「画像や音声の作成に利用した」などの話を耳にすると、まだまだ改良されている途上の様に感じます。しかし世界的に見ると、生成AIの性能向上は基本的に多量のデータを読み込ませることであり、その意味ではすでに限界は現れてきたているととらえられているようですね。


こんな感じで明日もこの続きを読みます。


Englishラボ
MisTy

×

非ログインユーザーとして返信する