特徴 ジェネレーティブ AI は、技術が人間の査読を欺く可能性を示しているため、科学論文の不正に取り組む学術出版社に興味深い課題をもたらします。
DALL-E、Stable Diffusion、Midjourney の画像を記述すると、数秒で生成されます。 これらのテキストから画像へのシステムは、過去数年間で急速に改善され、最初は研究プロトタイプとして始まったもので、無害で驚くほど奇妙なものを生み出しています イラスト 2021 年に犬の散歩をしている大根の赤ちゃんの画像は、その後、XNUMX 億ドル規模の企業によって構築された商用ソフトウェアに姿を変え、ますますリアルな画像を生成できるようになりました。
これらの AI モデルは、人間の顔、物体、シーンのリアルな画像を生成できます。また、説得力のある科学的な画像やデータを作成できるようになるのも時間の問題のようです。 テキストから画像へのモデルは現在、広くアクセス可能であり、かなり安価に使用できるため、危険な科学者が結果を偽造し、偽の研究をより簡単に公開するのに役立つ可能性があります.
画像操作は、学術出版社にとってすでに最大の懸念事項です。 一般的な形式 最近の科学的不正行為の。 作成者は、同じ画像の一部を反転、回転、トリミングするなど、あらゆる種類のトリックを使用して偽のデータを作成できます。 編集者は、提示されているすべての結果が本物であり、自分の作品を公開すると信じ込まされています。
現在、多くのパブリッシャーが AI ソフトウェアに目を向けています。 検出 レビュープロセス中の画像重複の兆候。 ほとんどの場合、画像はデータを混乱させた科学者によって誤って複製されていますが、露骨な詐欺に使用されることもあります.
しかし、パブリッシャーが画像の複製を把握し始めたのと同じように、別の脅威が出現しています。 一部の研究者は、生成 AI モデルを使用して偽のデータを作成したくなるかもしれません。 実際、偽の科学者がすでにこれを行っていることを示唆する証拠があります。
論文で発見されたAI製の画像?
2019 年、DARPA はセマンティック フォレンジック (セマフォー) プログラムは、偽情報と闘うために、AI で作成されたメディアを検出できる法医学ツールを開発する研究者に資金を提供しています。
アンクルサムの防衛研究機関の広報担当者は、AI を使用して生成されたと思われる本物の科学論文に掲載された偽の医療画像を発見したことを確認しました。 テキストから画像へのモデルの前は、敵対的生成ネットワークが一般的でした。 DARPAは、ディープフェイクを作成する能力で最もよく知られているこれらのモデルが、医療スキャン、細胞、または生物医学研究でよく見られる他の種類の画像の画像を偽造できることを認識しました.
SemaFor のプログラム マネージャーである William Corvey 氏は次のように述べています。 登録. 「このテクノロジーは、無害な目的のために遍在するようになりつつあります。」 Corvey 氏によると、同機関は GAN で作成された画像を検出できるソフトウェアの開発にある程度成功しており、ツールはまだ開発中です。
脅威の状況は急速に変化しています
「生成された画像の内容に関係なく、以前に検出することを学んだ生成メカニズムの「兄弟または遠いいとこ」を検出できることを示唆する結果があります。 Sema 分析では、メタデータ、統計的異常からより視覚的な表現に至るまで、操作されたメディアに関連するさまざまな属性と詳細を調べます」と彼は言いました。
科学論文のデータを精査している一部の画像アナリストは、GAN によって生成された画像のように見えるものにも遭遇しました。 GAN は敵対的生成ネットワークであり、文章、音楽、画像などを生成できる機械学習システムの一種です。
たとえば、シドニー大学の分子腫瘍学教授である Jennifer Byrne と、ジャーナル出版社 EMBO Press の画像完全性アナリストである Jana Christopher は、生化学関連の 17 の研究で見られた奇妙な一連の画像に出会いました。
写真は、一般的にとして知られている一連のバンドを描いています。 ウエスタンブロット、サンプル中の特定のタンパク質の存在を示しており、不思議なことに、すべてが同じ背景を持っているように見えました. それは起こるはずがありません。
赤と緑の輪郭で強調されたウエスタンブロット画像の背景の繰り返しの例…出典: バーン、クリストファー 2020
2020 年、Byrne と Christopher は、疑わしい画像はおそらく製紙工場の操業の一環として作成されたものであるという結論に達しました。これは、偽造データを使用して生化学研究に関する論文を大量生産し、それらを査読して公開するための取り組みです。 このようなケーパーは、たとえば、受け入れられた論文出力に基づいて報酬を受け取る学者に利益をもたらすため、または部門が発行されたレポートの割り当てを達成するのを助けるために行われる可能性があります。
「に示されている例のしみ 私たちの紙 コンピューターで生成された可能性が最も高い」とクリストファーは語った 登録.
主にウエスタンブロットですが、ますます顕微鏡画像も見られます。
「出版前と出版後の両方の論文をスクリーニングすると、主にウエスタンブロットですが、ますます顕微鏡画像である、偽物のように見える画像に出くわすことがよくあります. これらの多くが GAN を使用して生成された可能性が高いことを認識しています。」
フリーランスの画像探偵である Elisabeth Bik も、画像がいつ操作されたかを知ることができます。 彼女は科学論文の原稿に目を通し、重複する画像を探し、ジャーナル編集者がさらに調査できるようにこれらの問題にフラグを立てます。 しかし、アルゴリズムによって包括的に生成された偽画像と戦うのは困難です。
彼女は、バーンとクリストファーの研究で強調された画像の繰り返しの背景は偽造の明らかな兆候ですが、実際の西部のしみ自体は独特であると指摘しました. Bik が書類をスキャンして画像の不正を検出するために使用するコンピューター ビジョン ソフトウェアは、実際のしみの重複がないため、これらのバンドにフラグを立てるのは困難です。
「オーバーラップを見つけることは決してありません。 それらはすべて人工的に作られたものだと思います。 正確には、よくわかりません」と彼女は語った 登録簿。
最新のジェネレーティブ AI モデルを使用すると、偽の画像を簡単に生成できます
GAN は、拡散モデルに大きく取って代わられました。 これらのシステムは、独自の画像を生成し、DALL-E、Stable Diffusion、Midjourney などの今日のテキストから画像へのソフトウェアを強化します。 オブジェクトや概念の視覚的表現を自然言語にマッピングすることを学び、学術的な不正行為の障壁を大幅に下げることができます。
科学者は、どのタイプの誤ったデータを生成したいかを説明するだけで、これらのツールがそれを実行してくれます。 ただし、現時点では、現実的な科学画像を作成することはまだできていません。 ツールは、一見すると説得力があるように見える細胞のクラスターを生成することがありますが、ウエスタンブロットに関しては惨めに失敗します。
これは、これらの AI プログラムが生成できる種類のものです。
ここに @OpenAIの DALL-E は生体細胞のプロンプトを処理します
具体的には、「顕微鏡下の細胞」および「走査型電子顕微鏡下のT細胞」 pic.twitter.com/BgcZr3k5Q5
— タラ・バス・トリヴェディ (@tbt94) 2022 年 8 月 23 日
William Gibson – 有名な著者ではなく、医師科学者であり、腫瘍内科のフェローである – には、さらに例があります。 こちら、今日のモデルがウエスタンブロットの概念とどのように格闘しているかを含めます。
ただし、開発者がより多くのデータを使用してより大きなモデルをトレーニングするにつれて、テクノロジは改善される一方です。
Smut Clyde として知られる、科学論文の画像操作を認識する別の専門家である David Bimler 氏は、次のように述べています。
「彼らは単に古い論文から[ウェスタン ブロット]をコピーすることもできますが、それにも古い論文を検索する作業が必要です。 現時点では、GAN の使用にはまだ多少の努力が必要だと思います。 それは変わるだろうが」と彼は付け加えた。
DARPA は現在、SemaFor プログラムを拡張して、テキストから画像へのシステムを研究しようとしています。 「これらの種類のモデルはかなり新しいものであり、範囲内ではありますが、SemaFor に関する現在の作業の一部ではありません」と Corvey 氏は述べています。
「しかし、SemaFor の評価担当者は、2023 年秋に始まるプログラムの次の評価段階でこれらのモデルを検討する可能性があります。」
一方で、学術出版社が AI によって生成された偽の画像を論文で検出する方法を見つけられない場合、科学研究の質は低下します。 最良のシナリオでは、この形式の学術詐欺は、とにかくあまり注目されていない製紙工場のスキームに限定されます. 最悪のシナリオでは、最も評判の良いジャーナルにさえ影響を与え、善意の科学者は、真実であると信じている誤った考えを追いかけて時間とお金を浪費します. ®
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- Platoblockchain。 Web3メタバースインテリジェンス。 知識の増幅。 こちらからアクセスしてください。
- 情報源: https://go.theregister.com/feed/www.theregister.com/2023/03/11/ai_scientfic_fraud/
- :は
- $UP
- 2019
- 2020
- 2021
- 2023
- a
- 能力
- アカデミック
- アクセス可能な
- 越えて
- 追加されました
- 敵対者
- 代理店
- AI
- アルゴリズム
- すべて
- 既に
- しかし
- アナリスト
- アナリスト
- 分析論
- &
- 別の
- 現れる
- 登場
- です
- AS
- 関連する
- At
- 注意
- 著者
- 著者
- 赤ちゃん
- 背景
- 背景
- バリア
- ベース
- BE
- なぜなら
- になる
- 始まった
- 始まる
- 開始
- さ
- 信じる
- 信じる
- 恩恵
- BEST
- より良いです
- 生物医学
- 内蔵
- by
- 缶
- できる
- 例
- 細胞
- 課題
- 変化する
- 安い
- 最も安い
- 浮気
- クリストファー
- CO
- 戦闘
- 来ます
- コマーシャル
- 一般に
- 企業
- 補償された
- コンピュータ
- Computer Vision
- コンピューターで生成
- コンセプト
- コンセプト
- 懸念
- 結論
- 確認済み
- コンテンツ
- 可能性
- 作ります
- 作成
- 電流プローブ
- ドール
- ダーパ
- データ
- ディープフェイク
- 防衛
- 部門
- 説明する
- 細部
- 開発者
- 開発
- 開発
- 虚偽情報
- 変位
- 遠い
- 犬
- すること
- 間に
- 容易
- 簡単に
- 努力
- 新興の
- エーテル(ETH)
- 評価
- さらに
- すべてのもの
- 証拠
- 正確に
- 例
- 例
- 詳細
- エキスパート
- 顔
- フェイル
- かなり
- 偽
- 秋
- 有名な
- 最速
- 仲間
- 少数の
- フィギュア
- もう完成させ、ワークスペースに掲示しましたか?
- 名
- フラグ
- 法医学
- フォレンジック
- 偽造する
- フォーム
- 発見
- 詐欺
- フリーランス
- から
- 資金調達
- さらに
- GAN
- 生成する
- 生成された
- 生成
- 生々しい
- 生成的な敵対的ネットワーク
- 生成AI
- ゲノム
- 取得する
- 受け
- ひと目
- 行く
- 良い
- グリーン
- 起こる
- ハード
- 持ってる
- 助けます
- 強調表示された
- ヒット
- 認定条件
- しかしながら
- HTTPS
- 人間
- 狩猟
- i
- 考え
- 画像
- 画像
- 影響
- 改善されました
- in
- 含めて
- ますます
- 示す
- 当初
- 整合性
- 意図
- 興味深い
- 無関係に
- 問題
- IT
- ITS
- ジェニファー
- ジャーナル
- JPG
- 既知の
- ラベル
- 風景
- 言語
- 主として
- より大きい
- 遅く
- 最新の
- 打ち上げ
- LEARN
- 学んだ
- ような
- 可能性が高い
- 限定的
- 見て
- のように見える
- 探して
- 製
- マネージャー
- 操作
- 操作
- 多くの
- 地図
- 質量
- 問題
- メカニズム
- メディア
- 医療の
- 方法
- 顕微鏡検査
- ミッドジャーニー
- かもしれない
- モデル
- 分子の
- 瞬間
- お金
- 他には?
- 最も
- 移動する
- 音楽を聴く際のスピーカーとして
- ナチュラル
- 自然言語
- ネットワーク
- ネットワーク
- 新作
- 次の
- NIHの
- オブジェクト
- of
- 古い
- on
- 腫瘍学
- ONE
- 操作
- その他
- 輪郭
- 出力
- 紙素材
- 論文
- 部
- 部品
- 過去
- ピア
- 相
- ピクチャー
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- 人気
- ポーズ
- 潜在的な
- 電力
- 主に
- プレゼンス
- PLM platform.
- かなり
- 前に
- 多分
- プロセス
- 作り出す
- 生産された
- 製品
- 東京大学大学院海洋学研究室教授
- 演奏曲目
- プログラム
- タンパク質
- プロトタイプ
- パブリッシュ
- 公表
- 出版社
- 出版社
- 目的
- 品質
- 急速に
- RE
- リアル
- 現実的な
- 実現
- 受け取ります
- レッド
- 登録
- 繰り返される
- レポート
- 表現
- 評判の良い
- 研究
- 研究者
- 結果
- レビュー
- 日
- s
- 前記
- サム
- 同じ
- スキャン
- スキャニング
- シナリオ
- シーン
- スキーム
- 科学
- 科学研究
- 科学者たち
- スコープ
- スクリーニング
- を検索
- 秒
- 見えた
- セマフォ
- シリーズ
- セッションに
- 示す
- 作品
- 符号
- 著しく
- サイン
- 単に
- から
- 探偵
- ソフトウェア
- 一部
- ソース
- 特定の
- スポークスパーソン
- Spot
- 安定した
- 統計的
- まだ
- 奮闘
- 研究
- 勉強
- 成功
- そのような
- 想定
- 疑わしい
- シドニー
- システム
- テクノロジー
- それ
- アプリ環境に合わせて
- それら
- 自分自身
- ボーマン
- もの
- 脅威
- 介して
- 時間
- 〜へ
- 今日
- あまりに
- 豊富なツール群
- top
- トレーニング
- true
- ターニング
- さえずり
- 遍在する
- 下
- ユニーク
- 大学
- シドニー大学
- us
- つかいます
- 多様
- Ve
- ビジョン
- ウォーキング
- 無駄
- 方法
- 西部の
- この試験は
- which
- while
- 誰
- 広く
- 意志
- 仕事
- でしょう
- 書き込み
- 年
- ゼファーネット