生成 AI のおかげで、科学の不正行為を捕まえるのはこれほど困難になる

プラトン再発行

フォロワー： 0

特徴ジェネレーティブ AI は、技術が人間の査読を欺く可能性を示しているため、科学論文の不正に取り組む学術出版社に興味深い課題をもたらします。

DALL-E、Stable Diffusion、Midjourney の画像を記述すると、数秒で生成されます。これらのテキストから画像へのシステムは、過去数年間で急速に改善され、最初は研究プロトタイプとして始まったもので、無害で驚くほど奇妙なものを生み出していますイラスト 2021 年に犬の散歩をしている大根の赤ちゃんの画像は、その後、XNUMX 億ドル規模の企業によって構築された商用ソフトウェアに姿を変え、ますますリアルな画像を生成できるようになりました。

これらの AI モデルは、人間の顔、物体、シーンのリアルな画像を生成できます。また、説得力のある科学的な画像やデータを作成できるようになるのも時間の問題のようです。テキストから画像へのモデルは現在、広くアクセス可能であり、かなり安価に使用できるため、危険な科学者が結果を偽造し、偽の研究をより簡単に公開するのに役立つ可能性があります.

画像操作は、学術出版社にとってすでに最大の懸念事項です。一般的な形式最近の科学的不正行為の。作成者は、同じ画像の一部を反転、回転、トリミングするなど、あらゆる種類のトリックを使用して偽のデータを作成できます。編集者は、提示されているすべての結果が本物であり、自分の作品を公開すると信じ込まされています。

現在、多くのパブリッシャーが AI ソフトウェアに目を向けています。検出レビュープロセス中の画像重複の兆候。ほとんどの場合、画像はデータを混乱させた科学者によって誤って複製されていますが、露骨な詐欺に使用されることもあります.

しかし、パブリッシャーが画像の複製を把握し始めたのと同じように、別の脅威が出現しています。一部の研究者は、生成 AI モデルを使用して偽のデータを作成したくなるかもしれません。実際、偽の科学者がすでにこれを行っていることを示唆する証拠があります。

論文で発見されたAI製の画像？

2019 年、DARPA はセマンティックフォレンジック (セマフォー) プログラムは、偽情報と闘うために、AI で作成されたメディアを検出できる法医学ツールを開発する研究者に資金を提供しています。

アンクルサムの防衛研究機関の広報担当者は、AI を使用して生成されたと思われる本物の科学論文に掲載された偽の医療画像を発見したことを確認しました。テキストから画像へのモデルの前は、敵対的生成ネットワークが一般的でした。 DARPAは、ディープフェイクを作成する能力で最もよく知られているこれらのモデルが、医療スキャン、細胞、または生物医学研究でよく見られる他の種類の画像の画像を偽造できることを認識しました.

SemaFor のプログラムマネージャーである William Corvey 氏は次のように述べています。登録. 「このテクノロジーは、無害な目的のために遍在するようになりつつあります。」 Corvey 氏によると、同機関は GAN で作成された画像を検出できるソフトウェアの開発にある程度成功しており、ツールはまだ開発中です。

脅威の状況は急速に変化しています

「生成された画像の内容に関係なく、以前に検出することを学んだ生成メカニズムの「兄弟または遠いいとこ」を検出できることを示唆する結果があります。 Sema 分析では、メタデータ、統計的異常からより視覚的な表現に至るまで、操作されたメディアに関連するさまざまな属性と詳細を調べます」と彼は言いました。

科学論文のデータを精査している一部の画像アナリストは、GAN によって生成された画像のように見えるものにも遭遇しました。 GAN は敵対的生成ネットワークであり、文章、音楽、画像などを生成できる機械学習システムの一種です。

たとえば、シドニー大学の分子腫瘍学教授である Jennifer Byrne と、ジャーナル出版社 EMBO Press の画像完全性アナリストである Jana Christopher は、生化学関連の 17 の研究で見られた奇妙な一連の画像に出会いました。

写真は、一般的にとして知られている一連のバンドを描いています。ウエスタンブロット、サンプル中の特定のタンパク質の存在を示しており、不思議なことに、すべてが同じ背景を持っているように見えました. それは起こるはずがありません。

赤と緑の輪郭で強調されたウエスタンブロット画像の背景の繰り返しの例…出典：バーン、クリストファー 2020

2020 年、Byrne と Christopher は、疑わしい画像はおそらく製紙工場の操業の一環として作成されたものであるという結論に達しました。これは、偽造データを使用して生化学研究に関する論文を大量生産し、それらを査読して公開するための取り組みです。このようなケーパーは、たとえば、受け入れられた論文出力に基づいて報酬を受け取る学者に利益をもたらすため、または部門が発行されたレポートの割り当てを達成するのを助けるために行われる可能性があります。

「に示されている例のしみ私たちの紙コンピューターで生成された可能性が最も高い」とクリストファーは語った登録.

主にウエスタンブロットですが、ますます顕微鏡画像も見られます。

「出版前と出版後の両方の論文をスクリーニングすると、主にウエスタンブロットですが、ますます顕微鏡画像である、偽物のように見える画像に出くわすことがよくあります. これらの多くが GAN を使用して生成された可能性が高いことを認識しています。」

フリーランスの画像探偵である Elisabeth Bik も、画像がいつ操作されたかを知ることができます。彼女は科学論文の原稿に目を通し、重複する画像を探し、ジャーナル編集者がさらに調査できるようにこれらの問題にフラグを立てます。しかし、アルゴリズムによって包括的に生成された偽画像と戦うのは困難です。

彼女は、バーンとクリストファーの研究で強調された画像の繰り返しの背景は偽造の明らかな兆候ですが、実際の西部のしみ自体は独特であると指摘しました. Bik が書類をスキャンして画像の不正を検出するために使用するコンピュータービジョンソフトウェアは、実際のしみの重複がないため、これらのバンドにフラグを立てるのは困難です。

「オーバーラップを見つけることは決してありません。それらはすべて人工的に作られたものだと思います。正確には、よくわかりません」と彼女は語った 登録簿。

タイムスタンプ： 2024 年 1 月 10 日

ジェネレーティブ AI のおかげで、詐欺の科学を捕まえるのはこれまで以上に難しくなります

プラトン再発行

論文で発見されたAI製の画像？

最新のジェネレーティブ AI モデルを使用すると、偽の画像を簡単に生成できます

より多くの登録

Steam、開発者にゲーム内の AI 製コンテンツを公開するよう指示

イーロン・マスクは、2021年にニューラリンクの幹部と秘密の双子をもうけました

Waymo ロボタクシーは、誰も殺さずに XNUMX 万マイルを達成

成功への道を切り開く

ウェーハスケール、原子スケールに対応：アンクルサムが核兵器シミュレーションでセレブラスチップをテスト

中国、国産AIインフラをやるべきことリストに加える

実際にスマートな小さなAIロボットを構築したい場合は、昆虫に目を向けてください

ワシントン、AI訓練の疑いがあるクラウドを監視することを検討

乳がん検診AIアプリwatchdogがOK！

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

論文で発見されたAI製の画像？

最新のジェネレーティブ AI モデルを使用すると、偽の画像を簡単に生成できます

より多くの 登録

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

より多くの登録