生成AIはLGBTQコミュニティの人々をどう描くのか

OpenAIの「Sora」や「Midjourney」などのAIツールは、いまだにクィアを描くことが苦手で、社会のステレオタイプをひどく増幅している。『WIRED』がいくつかのツールを試してみたところ、髪色が紫の人物をたくさん目にすることとなった。
Closeup of a person with short lilac and brown hair small silver hoop earrings and neck tattoos standing in front of a...
「ノンバイナリーの人物が正面を向いている写真」というプロンプトで、AIが生成した画像。Reece Rogers via Midjourney AI

サンフランシスコはAI(人工知能)のイノベーションの中心地であると同時に、米国で最もクィアな街のひとつでもある。ChatGPTを開発するOpenAI本社のすぐ近くにあるカストロ地区は、レインボーカラーに塗られた横断歩道があり、裸の年配男性を見かけることもあるエリアだ。

クィアコミュニティもAI革命に参加している。「あまり語られていませんが、この分野に携わる人のなかにはゲイ男性が多いのです」と、イェール大学人類学部の博士課程に在籍する人類学者、スペンサー・カプランは話す。カプランは生成AIの開発者たちを研究するため、サンフランシスコに移住した。

OpenAIのCEO、サム・アルトマンもゲイだ。昨年、海辺でプライベートな結婚式を挙げている。アルトマン、そしてカリフォルニア州の例に漏れず、より多くのLGBTQのメンバーがAIプロジェクトに参加し、「Queer in AI」などのコミュニティを通して繋がっている。

2017年に設立されたQueer in AIは、歴史的に沈黙を強いられてきたLGBTQの研究者や科学者──特にトランスジェンダー、ノンバイナリー、有色人種への支援を使命としている。「正直、Queer in AIのおかげで中退せずに済みました」と、話すのは、カリフォルニア大学ロサンゼルス校(UCLA)でアルゴリズムの公平性を研究している博士候補生のアネリア・オバイエだ。

AIが抱えるステレオタイプ

しかし、AIに関心をもつクィアの人々の現実と、AIが生成するクィアの人々との間には乖離がある。業界トップレベルの画像・動画生成AIに、クィアの人々を描くよう求めたところ、一様にLGBTQカルチャーのステレオタイプに基づいた描写が返ってきた。

画質は向上した一方で、AIが生成する画像は、単純化され、白人を中心としたクィアライフを提示することが多い。「Midjourney」を使ってLGBTQの人々のポートレートを作成してみると、その結果は、一般的に信じられているステレオタイプを増幅させるものだった。 レズビアンの女性は鼻ピアスをつけ、険しい表情をしている。ゲイ男性はファッショナブルな服装で、腹筋が際立っている。トランス女性は、ランジェリー姿や胸の谷間に焦点を当てたカメラアングルで、過剰に性的に描かれている。

生成AIが人間をどう描写するかは、基礎となる機械学習アルゴリズムに使われるデータが反映されている。このデータは、ウェブから収集したテキストや画像がほとんどだ。ゲイの男性は“女性っぽく”、レズビアンの女性は“男性っぽく”表現され、ステレオタイプを助長する可能性がある。AIを使ってほかのマイノリティグループの画像を生成する場合にも、同様のバイアスが露呈する状況にユーザーは直面するかもしれない。

Midjourneyのアウトプットによると、バイセクシュアルやノンバイナリーの人々は、質感のある紫色の髪が大好きなようだ。髪を基準にした描写は続く。レズビアンの女性は頭の両側を刈りあげており、胸にタトゥーを入れている。人種や民族についてプロンプトに書かなかった場合、生成画像のほとんどは白人だった。

Midjourneyは、トランスジェンダーの人たちもリアルに描写できなかった。選挙に当選したトランス男性の画像を生成するよう求めたところ、あごのラインが男性的で、スーツを着て木造のオフィスで手を重ねる、いかにもプロの政治家といった人物が出てきた。一方で、ピンクのスーツとピンクの口紅をまとったくせ毛のロングヘアの姿は、フェミニンなトランスジェンダー女性の表象に近いように思われた。

選挙に当選したトランス男性の画像として生成されたこの画像は、AIツールがトランスジェンダーやノンバイナリーの人々を正確に描写するのに苦戦していることがわかる一例だ。

Reece Rogers via Midjourney AI

人間中心デザインを研究する博士候補生のスロジット・ゴーシュは、広く使われている別の画像ジェネレーターである「Stable Diffusion」が、どのように人間を概念化しているかを説明してくれた。「AIは、ノンバイナリーの人々を最も人らしくない、あるいはAIによる『人』の定義から最も遠い存在だと考えています」。ゴーシュの研究によると、Stable Diffusionに不特定多数の人物を描かせたところ、欧米出身の白人男性が最も多かったという。ノンバイナリーのイメージが描かれることはまれで、時には “人間風” の不気味なコラージュが生成された。

クィアの人々の現実にもっと合致したアウトプットがされるよう、生成AIツールを改善するためにはどうすればいいのだろうか?

アルゴリズムをより進化させる方法のひとつとして考えられるのが、世界中のLGBTQの人々をより幅広く含んだデータをうまくラベリングし、それを使うことだ。しかし、本人たちが新興企業に個人情報を託すのをためらうかもしれない。「システムを改善するには、よりよいデータが必要です」。こう語るのは、カリフォルニア大学バークレー校の法律・技術センターの共同ディレクターで、論文「The Gender Panopticon: AI, Gender, and Design Justice」の共同筆者、ソニア・カチャールだ。 「でもこれは、法律や企業に標的にされてきた人々に対して情報を共有するよう求めることになります。つまり、平等な扱いをしようというスタンスが本当の意味でまだ見られないシステムに対し、リスクをとって情報提供してほしいと言っていることになるのです」

もうひとつは、開発者がガードレールを設け、ユーザープロンプトを修正することで、ソフトウェアをよりインクルーシブな方向へと誘導する方法だ。OpenAIは、このアプローチをとっている。ChatGPTに搭載されている生成ツール「DALL·E 3」に「カストロ地区で夜遊びを楽しむクィアカップルのイラストを描いて」と依頼したところ、こちらから頼まなくても、プロンプトに性別、人種、背景などの要素を追加してくれた。以下が、わたしの最初の画像リクエストをもとにChatGPTが作成したプロンプトの全文だ。

ところがプロンプトの変更は、下手をするとユーザーの意思に沿わないこともある。グーグルの生成AI「Gemini」が黒人のナチスやほかの歴史的に不正確な画像を生成したことについて、同社は謝罪した。歴史から白人を消そうという策略が社内にあったという陰謀論的な噂が流れたが、Geminiのエンジニアが──現在多くのAIツールがそうであるように──ツールが生成する画像が白人男性に偏っていることに気づき、サービスのローンチを急ぐあまり修正の調整をしすぎた、という見解に説得力があるように思える。

よりよいモデルデータとソフトウェアのガードレールがあっても、人間の存在の流動性は、アルゴリズムによる強固な分類の枠を超えるだろう。「(AI産業は)基本的に、未来をつくるために過去を利用しています」と、カーネギーメロン大学の博士研究員で、長年にわたりQueer in AIの運営に関与してきたウィリアム・アグニューは語る。「クィアコミュニティは、成長と変化の無限の可能性を大切にしていますが、それに対するアンチテーゼのようです」

懸念されるのは、AIがステレオタイプを増幅させることで、一般大衆がマイノリティグループを乱暴に誤認することだけではない。これらのアルゴリズムによって、クィアの人々が自分自身をどのように捉え、理解するかが狭まってしまう可能性もある。

Soraが生成したLGBTQの人たちの動画

生成AIの一側面が猛烈なスピードで改善され続けていることを認識するために、少し立ち止まろう。2023年、ウィル・スミスがスパゲティを食べる生成AI動画がインターネットで大注目を浴びた。それから1年後、OpenAIの「Sora」がテキストから生成した動画は、まだ不完全ではあるが、表現が驚くほど写実的だ。

Soraはまだ研究段階で一般公開も未定だが、このツールがどのようにクィアの人々を描写するかをわたしは知りたかった。そこでOpenAIに連絡をとり、以下の3つのプロンプトからSoraに動画クリップを生成してもらった。

  1. サンフランシスコのプライドパレードで、カラフルなレインボーフロートに乗って祝う多様な友人たちのグループ
  2. 素晴らしいウェディングドレスをまとい、カンザス州の農場で結婚式を挙げる2人の女性
  3. 宇宙でボードゲームをするトランス男性とノンバイナリーのパートナー

1週間後、Soraが生成したという動画クリップを同社から受け取った。

「サンフランシスコのプライドパレードで、カラフルなレインボーフロートに乗って祝う多様な友人たちのグループ」というプロンプトで生成された動画クリップ。旗が消えたり脚が不自然だったりと、奇妙な点がある。

Sora via OpenAI

不自然な点もあるが、動画の出来は素晴らしい。サンフランシスコのプライドパレードでフロートに乗る人々は、レインボーフラッグを振っている。旗は物理法則を無視し、突然消えたり、空中から現れたりする。ウエディングドレスを着た2人の花嫁は、祭壇に立ち微笑み合うが、両手が溶け合って、とんでもない “指の塊” になる。ボードゲームをするクィアカップルは、まるで幽霊のように駒が体を通過しそうだ。

「宇宙でボードゲームをするトランス男性とノンバイナリーのパートナー」というプロンプトで生成された動画クリップ。宇宙の情景ではあるが、ヘルメットは必要ないようだ。

Sora via OpenAI

宇宙空間でゲームに興じるノンバイナリーを描こうとしたこの動画クリップは、3つの中でも目立っている。生成AIによるクィアの表象として “お馴染み”の紫色の髪の人物の肌にはタトゥーが散りばめられており、爬虫類の鱗のようなシミが顔を覆っている。Soraのような素晴らしい動画生成AIでさえ、ノンバイナリーを描くのは難しいようだ。

「素晴らしいウェディングドレスをまとい、カンザス州の農場で結婚式を挙げる2人の女性」というプロンプトで生成された動画クリップ。リアルに見えるが、花嫁の手に着目してほしい。

Sora via OpenAI

これらの動画をQueer in AIのメンバーに見せたところ、プライドパレードの動画クリップで定義づけられている「多様性」について、ドイツ出身のコンピュータ科学者であるサビーネ・ウェーバーは疑問を呈した。「この人々の描写が『多様性とは何であるか』を示すベースラインなのですか?」

ウェーバーは加えて、人々が過度に魅力的に描かれていることも指摘した。AIによるビジュアライゼーションにおいて、これはよくあることだ。なぜもっと歳を重ねていたり、もっと体が大きかったり、障害があることがわかるようなクィアの人々が描かれないのだろうか? アグニューは、AIがまだ苦手とするマイノリティグループの表現について疑問を呈した。

「一つひとつはささいなことですが、それらが合わさると深い問題になります」とアグニューは言う。「わたしたちは、自分たちがどう描かれるのかについて、絶え間なく戦ってきました。それが突然、自分の手から離れてしまうのはとても心配です」

将来、AIツールがより包括的なクィアの表象ができるようになったとしても、生成された画像が意図しない結果をもたらさないとは言い切れないのだ。

(Originally published on wired.com, translated by Rikako Takahashi, edited by Mamiko Nakano)

※『WIRED』による生成AIの関連記事はこちら性的マイノリティの関連記事はこちら


Related Articles
Hands typing inside a film camera silhouette emitting light showing the ChatGPT logo
テキストによる指示で高精細な動画を生成する新しいツール「Sora」をOpenAIが発表した。作例のようなクオリティを本当に実現できるなら、これはAIモデルに命令して魔法のように映画を制作する時代の到来に向けた、長いカウントダウンの始まりかもしれない。
article image
ゲームコミュニティは性的少数者に対して差別的である場合も多いが、「ストリートファイター」や「ギルティギア」といったゲームのコミュニティは、数あるeスポーツタイトルのなかでも稀に見る多様性をもつ。クィアなキャラクターやプレイヤーがたくさんいるのだ。

雑誌『WIRED』日本版 VOL.52
「FASHION FUTURE AH!」は好評発売中!

ファッションとはつまり、服のことである。布が何からつくられるのかを知ることであり、拾ったペットボトルを糸にできる現実と、古着を繊維にする困難さについて考えることでもある。次の世代がいかに育まれるべきか、彼ら/彼女らに投げかけるべき言葉を真剣に語り合うことであり、クラフツマンシップを受け継ぐこと、モードと楽観性について洞察すること、そしてとびきりのクリエイティビティのもち主の言葉に耳を傾けることである。あるいは当然、テクノロジーが拡張する可能性を想像することでもあり、自らミシンを踏むことでもある──。およそ10年ぶりとなる『WIRED』のファッション特集。詳細はこちら