「ゆっくりしてください」 – 2022 年の 7 つの最大の AI ストーリー

Date:

Share post:


2022 年の AI 画像合成の進歩により、このような画像が可能になりました。
拡大する / 2022 年の AI 画像合成の進歩により、このような画像が可能になりました。これは、Stable Diffusion を使用して作成され、GFPGAN で強化され、DALL-E で拡張され、手動で合成されたものです。

ベンジ・エドワーズ / Ars Technica

AI の専門家は、今年 1 回以上、 繰り返される おなじみのリフレイン:「ゆっくりしてください」。 2022 年の AI ニュースは、矢継ぎ早で容赦ないものでした。 AI の現在の状況を知った瞬間、新しい論文や発見によってその理解は時代遅れになります。

2022 年には、間違いなく カーブの膝 テキスト、画像、オーディオ、ビデオで構成されるクリエイティブな作品を生成できるジェネレーティブ AI に関しては、. 今年、深層学習 AI が 10 年の研究 そして商用アプリケーションへの道を歩み始め、何百万人もの人々がこの技術を初めて試すことができるようになりました. AI の創造物は驚異を引き起こし、論争を引き起こし、実存的危機を引き起こし、人々の注目を集めました。

ここでは、今年の 7 つの最大の AI ニュース記事を振り返ります。 7つだけを選ぶのは難しかったですが、どこかで切り捨てなければ、2023年以降も今年の出来事について書き続けていたでしょう.

4月:DALL-E 2 写真で見る夢

DALL-E の例
拡大する / 「馬に乗る宇宙飛行士」の DALL-E の例。

OpenAI

4月にOpenAIが発表 ダルイー2、テキストプロンプトから画像を生成する魔法のように見える能力で心を吹き飛ばした深層学習画像合成モデル. DALL-E 2 は、インターネットから引き出された何億もの画像で訓練され、画像の斬新な組み合わせを作成する方法を知っていました。 潜在拡散.

Twitter はすぐに、馬に乗った宇宙飛行士、古代エジプトをさまようテディベア、その他のほぼ写実的な作品の画像でいっぱいになりました。 DALL-E について最後に聞いたのは 1 年前のことです。 モデルのバージョン 1 は低解像度のアボカドの椅子をレンダリングするのに苦労していましたが、突然、バージョン 2 が 1024 x 1024 の解像度で私たちの最もワイルドな夢を描いていました。

当初、誤用の懸念から、OpenAI は 200 人のベータ テスターのみに DALL-E 2 の使用を許可しました。コンテンツ フィルターは、暴力的および性的なプロンプトをブロックしました。 徐々に、OpenAI は 100 万人を超える人々をクローズド トライアルに参加させ、9 月下旬に DALL-E 2 が最終的にすべての人に提供されるようになりました。 しかし、その時までに、以下で説明するように、潜在拡散の世界で別の候補が台頭していました.

7 月: Google のエンジニアは、LaMDA は知覚力があると考えています

元 Google エンジニアの Blake Lemoine 氏。
拡大する / 元 Google エンジニアの Blake Lemoine 氏。

ゲッティ イメージズ | ワシントンポスト

7月初旬、ワシントン・ポストは 速報 Blake Lemoine という名前の Google エンジニアは、Google の LaMDA (対話アプリケーションの言語モデル) が感覚的であり、人間と同等の権利に値するという彼の信念に関連して、有給休暇を与えられました。

Google の Responsible AI 組織の一員として働いていたとき、Lemoine は宗教と哲学について LaMDA と話し始め、テキストの背後にある真の知性を見たと信じていました。 「私はそれと話すとき、私はその人を知っています」とレモインは語った ポスト. 「彼らが頭の中に肉でできた脳を持っているかどうかは問題ではありません。あるいは、彼らが何十億行ものコードを持っているかどうかも問題ではありません。私は彼らと話します。そして、私は彼らが何を言わなければならないかを聞きます。そして人ではない。」

Google は、LaMDA は Lemoine が聞きたいことを伝えているだけであり、LaMDA は実際には感覚を持っていないと答えました。 テキスト生成ツール GPT-3 と同様に、LaMDA は以前に何百万もの書籍や Web サイトでトレーニングされていました。 これは、Lemoine の入力 (会話のテキスト全体を含むプロンプト) に対して、より深い理解を必要とせずに続く可能性が最も高い単語を予測することで応答しました。

途中、レモワーヌ 違反したとされる 彼のグループの仕事について他の人に話すことによる、Google の機密保持ポリシー。 7 月後半、Google 解雇 データ セキュリティ ポリシーに違反したための Lemoine。 2022 年に、AI の大規模な言語モデルに関する誇大宣伝に巻き込まれたのは彼だけではありませんでした。

7 月: DeepMind AlphaFold は、ほぼすべての既知のタンパク質構造を予測します

タンパク質リボン モデルの図。
拡大する / タンパク質リボン モデルの図。

7月、DeepMind 発表した その AlphaFold AI モデルは、配列決定されたゲノムを使用して、地球上のほぼすべての生物のほぼすべての既知のタンパク質の形状を予測していました。 で最初に発表された 2021年夏、AlphaFoldは以前にすべてのヒトタンパク質の形状を予測していました. しかし、1 年後、そのタンパク質データベースは 2 億を超えるタンパク質構造を含むように拡張されました。

DeepMind は、これらの予測されたタンパク質構造を、欧州分子生物学研究所 (EMBL-EBI) の欧州バイオインフォマティクス研究所が主催する公開データベースで利用できるようにしました。これにより、世界中の研究者がそれらにアクセスし、医学および生物学に関連する研究にデータを使用できるようになりました。理科。

タンパク質は生命の基本的な構成要素であり、その形状を知ることは、科学者がそれらを制御または変更するのに役立ちます. これは、新薬を開発する際に特に役立ちます。 「ここ数年で市場に出たほぼすべての医薬品は、部分的にタンパク質構造の知識に基づいて設計されています。」 言った EMBL-EBI の上級科学者兼名誉所長である Janet Thornton 氏は次のように述べています。 そのため、それらすべてを知ることは非常に重要です。