生成AIの痕跡を学生レポート2,000万本超で検知。使い方の“線引き”はどうあるべきなのか

大学生らのレポートにAIがつくり出したコンテンツが相当量含まれている可能性があることを、AIライティング検知ツールを提供するTurnitinが発表した。だが、多様な生成AIソフトの使用/不使用の基準については、学生も教師もまだ試行錯誤の段階だ。
Illustration of four hands holding pencils that are connected to a central brain
Illustration: Jacqui VanLiew; Getty Images

過去1年間に学生たちが提出した2,200万本以上もの課題レポート作成に、生成AIが利用されていた可能性がある──。このようなデータが、レポートや論文の盗用チェック用ツールを提供する企業、Turnitin(ターンイットイン)によって公表された。

Turnitinは1年前、人工知能(AI)がつくった文章を検知するツールを発表した。学生が書いた膨大な数のレポートやそのほかのAIが作成したテキストで訓練されたソフトウエアだ。以来、主に高校生や大学生が書いた2億本以上のレポートがこの検知にかけられてきた。その結果、11%がAIによって書かれた言語を20%含み、3%はレポートの8割以上がAIによって書かれたものだと指摘された(Turnitinは『WIRED』の出版元であるコンデナストを所有する、アドバンス・パブリケーションズの傘下にある)。Turnitinは文書全体を分析する場合、判定を誤る可能性は1%以下だとしている。

ChatGPTの登場は、作文の授業はもう終わりだという条件反射的な不安を招いた。ChatGPTは情報を合成して即座に提示してくれる。だが、常に正しい答えをくれるとは限らない。生成AIは時に幻覚(ハルシネーション)を起こし、独自の事実を創り出したり、ありもしない学術的根拠を引用したりすることが知られている。生成AIのチャットボットがジェンダーや人種に関して偏った文章を吐き出す姿も目撃されている。こうした欠陥にもかかわらず、学生たちはチャットボットを研究に使ったり、考えをまとめる助けにしたり、あるいはゴーストライターとして活用したりしてきた。AIチャットボットが使われた痕跡は、査読を経て出版された学術論文にさえも存在する。

当然のことながら教師は、生徒が許可や使用の事実を明らかにすることなく生成AIを使ってレポートを書いた場合、その責任を問いたいと思っている。だが、そのためには、課題がAIを使って書かれたことを証明する確かな手立てを必要とする。教師たちはこれまでに何度も、AIが書いたものをチェックするための独自の方法を試してきた。わかりづらかったり、効果の立証されていない手法を使おうとし、生徒たちにストレスを与えてきたこともある。さらに問題をややこしくしたのが、教師のなかにも、成績をつけるプロセスで生成AIを用いる者がいたことだ

生成AIの検知は、盗用であるかどうかの類似性を見つけることほど単純ではないため、一筋縄ではいかない。なぜなら、AIが作成していても、ある意味その文章はオリジナルなものだからだ。加えて、学生が生成AIを使うやり方もさまざまだ。ある者は大部分あるいは全部を書いてくれとチャットボットに頼むかもしれないし、別の者はブレインストーミングをする相手、あるいは考える手助けとしてチャットボットを使ったりするからだ。

何を使ってよくて、何がいけないのか

学生が心惹かれるのはChatGPTのような大規模言語モデル(LLM)だけではない。ワードスピナーと呼ばれる、文章を書き換える別のタイプのAIソフトウエアもある。こうしたものを使えば、そのレポートが盗作なのか生成AIによるものなのかが、さらにわかりにくくなる。TurnitinのAI検知ツールはワードスピナーにも対応するようアップデートされていると、同社のチーフ・プロダクト・オフィサーのアニー・チェチテッリはいう。さらに、スペルを確認する「Grammarly」のようなサービスを使って修正された文章も見つけ出すことができるという。Grammarlyも独自の生成AIツールを備えている。こうした馴染みのソフトウエアが生成AIを搭載するようになるにつれ、学生は何を使ってよくて、何がいけないのか、いっそうわからなくなりつつあるのだ。

検知ツールそのものにも、偏りのリスクはある。英語を母語としない人は検知に引っかかりやすい可能性があると言われている。2023年の研究によると、TOEFL(外国語としての英語テスト)の結果を7つのAI検知ソフトウエアにかけると、61.3%もの誤判定があった。この研究ではTurnitinは試されていない。Turnitinは、英語ネイティブ同様、外国語として英語を学ぶ人々の文章でも訓練したという。10月に出された研究報告によると、学部生とAIが作成したレポートを調べさせたテストの結果、Turnitinは16のAI言語検知ソフトウエアのなかで最も正確なもののひとつと判定された

Turnitinを使っている学校は、無料のお試し期間として今年初めまでの間、このAI検知ソフトウエアを試すことができた。チェチテッリによると、試した顧客の大半がAI検知ソフトウエアの購入を決めたという。一方、誤判定のリスクがあることと英語を母語としない者に厳しい傾向があるのを理由に当面の購入を見合わせた大学もある。ニュージャージー州のモントクレア州立大学は11月、TurnitinのAI検知ソフトウエアの使用を中止すると発表した。ヴァンダービルト大学とノースウエスタン大学も昨夏に同様の決定をした。

「難しい問題です。ツールを欲しがる人が多い理由は理解できます」と、モントクレア州立大学教員卓越性事務局長のエミリー・アイザックスは話す。だが、AI検知が偏見に基づいた結果を出しかねないことと、盗用チェックの場合ほど確実ではないことに、大学側は懸念を抱いているとアイザックスは続ける。加えて、モントクレア州立大学は、AIを全面禁止にしようとは考えていない。学術界において、AIは何らかの役割を果たすと考えるからだ。時を経て、AIツールがもっと信頼されるようになれば、大学の方針も変更されるだろう。「永遠に導入しないという意味ではありません。当面の措置です」とアイザックスは言う。

Turnitinのツールが学生の成績を決める唯一の判断基準であってはならないと、チェチテッリは語る。そうではなく、いまは教員が学生と生成AIとの付き合い方について、微妙なニュアンスも含む、さまざま議論を始める機会なのだと言う。「どこで線引きするべきなのかは、誰もわかっていないのです」

(Originally published on wired.com, translated by Akiko Kusaoi, edited by Mamiko Nakano)

※『WIRED』による生成AIの関連記事はこちら


Related Articles
Students sitting at desks with laptops in a high school classroom
情報の不正確さや不正行為の温床になりうるとして、教育現場で会話型AI「ChatGPT」を禁止する学校が米国で増えている。一方で、教師や研究者からは“新時代の計算機”として思考を補助するツールになりうるとして、積極的な導入を求める声もある。

雑誌『WIRED』日本版 VOL.52
「FASHION FUTURE AH!」は好評発売中!

ファッションとはつまり、服のことである。布が何からつくられるのかを知ることであり、拾ったペットボトルを糸にできる現実と、古着を繊維にする困難さについて考えることでもある。次の世代がいかに育まれるべきか、彼ら/彼女らに投げかけるべき言葉を真剣に語り合うことであり、クラフツマンシップを受け継ぐこと、モードと楽観性について洞察すること、そしてとびきりのクリエイティビティのもち主の言葉に耳を傾けることである。あるいは当然、テクノロジーが拡張する可能性を想像することでもあり、自らミシンを踏むことでもある──。およそ10年ぶりとなる『WIRED』のファッション特集。詳細はこちら