نمایاں کریں جنریٹو AI سائنس کے مقالوں میں دھوکہ دہی سے نمٹنے کے لیے تعلیمی پبلشرز کے لیے دلچسپ چیلنجز پیش کرتا ہے کیونکہ ٹیکنالوجی انسانی ہم مرتبہ کے جائزے کو بے وقوف بنانے کی صلاحیت کو ظاہر کرتی ہے۔
Describe an image for DALL-E, Stable Diffusion, and Midjourney, and they'll generate one in seconds. These text-to-image systems have rapidly improved over the past few years and what initially began as a research prototype, producing benign and wonderfully bizarre عکاسی 2021 میں چلتے پھرتے کتوں کے بچے ڈائیکون مولیوں کا، اس کے بعد سے تجارتی سافٹ ویئر میں تبدیل ہو گیا ہے، جسے اربوں ڈالر کی کمپنیوں نے بنایا ہے، جو تیزی سے حقیقت پسندانہ تصاویر بنانے کے قابل ہے۔
These AI models can produce lifelike pictures of human faces, objects, and scenes, and it's looking like a matter of time before they get good at creating convincing scientific images and data too. Text-to-image models are now widely accessible, pretty cheap to use, and they could help dodgy scientists forge results and publish sham research more easily.
Image manipulation is already a top concern for academic publishers as it's the most عام شکل دیر سے سائنسی بدانتظامی کی. مصنفین ہر طرح کی ترکیبیں استعمال کر سکتے ہیں، جیسے کہ ایک ہی تصویر کے پرزوں کو پلٹنا، گھومنا، یا جعلی ڈیٹا کو تراشنا۔ ایڈیٹرز کو یہ یقین کرنے میں بے وقوف بنایا جاتا ہے کہ پیش کیے جانے والے تمام نتائج حقیقی ہیں اور وہ اپنا کام شائع کریں گے۔
بہت سے پبلشرز اب AI سافٹ ویئر کی طرف رجوع کرنے کی کوشش کر رہے ہیں۔ کا پتہ لگانے کے signs of image duplication during the review process. In most cases, images have been mistakenly duplicated by scientists who have muddled up their data, but sometimes it's used for blatant fraud.
لیکن جس طرح پبلشرز تصویر کی نقل پر گرفت حاصل کرنا شروع کر دیتے ہیں، ایک اور خطرہ ابھر رہا ہے۔ کچھ محققین کو جعلی ڈیٹا بنانے کے لیے جنریٹیو اے آئی ماڈلز استعمال کرنے کا لالچ دیا جا سکتا ہے۔ درحقیقت، ایسے شواہد موجود ہیں جو یہ بتاتے ہیں کہ سائنس دان پہلے ہی یہ کام کر رہے ہیں۔
AI سے بنی تصاویر کاغذات میں نظر آتی ہیں؟
2019 میں، DARPA نے اپنا Semantic Forensics شروع کیا (SemaFor) پروگرام، فارنزک ٹولز تیار کرنے والے محققین کو فنڈ فراہم کرتے ہیں جو کہ AI سے بنے میڈیا کا پتہ لگانے کے قابل ہیں، تاکہ غلط معلومات کا مقابلہ کیا جا سکے۔
A spokesperson for Uncle Sam's defense research agency confirmed it has spotted fake medical images published in real science papers that appear to be generated using AI. Before text-to-image models, generative adversarial networks were popular. DARPA realized these models, best known for their ability to create deepfakes, could also forge images of medical scans, cells, or other types of imagery often found in biomedical studies.
"The threat landscape is moving quite rapidly," William Corvey, SemaFor's program manager, told رجسٹر. "The technology is becoming ubiquitous for benign purposes." Corvey said the agency has had some success developing software capable of detecting GAN-made images, and the tools are still under development.
خطرے کا منظر کافی تیزی سے آگے بڑھ رہا ہے۔
"We have results that suggest you can detect 'siblings or distant cousins' of the generative mechanism you've learned to detect previously, irrespective of the content of the generated images. SemaFor analytics look at a variety of attributions and details associated with manipulated media, everything from metadata, statistical anomalies, to more visual representations," he said.
سائنسی کاغذات میں ڈیٹا کی جانچ کرنے والے کچھ تصویری تجزیہ کاروں نے یہ بھی دیکھا ہے کہ GAN سے تیار کردہ تصاویر کی طرح نظر آتے ہیں۔ ایک GAN ایک تخلیقی مخالف نیٹ ورک ہے، مشین لرننگ سسٹم کی ایک قسم جو تحریر، موسیقی، تصویریں اور بہت کچھ پیدا کر سکتا ہے۔
مثال کے طور پر، جینیفر برن، یونیورسٹی آف سڈنی میں مالیکیولر آنکولوجی کی پروفیسر، اور جریدے کے پبلشر EMBO پریس کی امیج انٹیگریٹی تجزیہ کار، جانا کرسٹوفر نے تصاویر کا ایک عجیب مجموعہ دیکھا جو بائیو کیمسٹری سے متعلق 17 مطالعات میں سامنے آئے۔
تصویروں میں بینڈ کی ایک سیریز کو دکھایا گیا ہے جسے عام طور پر جانا جاتا ہے۔ مغربی دھبے, which indicate the presence of specific proteins in a sample, that all curiously seemed to have the same background. That's not supposed to happen.
Examples of repeating backgrounds in western blot images, highlighted by the red and green outlines ... Source: برن، کرسٹوفر 2020
2020 میں، برن اور کرسٹوفر اس نتیجے پر پہنچے کہ مشکوک نظر آنے والی تصاویر شاید پیپر مل آپریشن کے حصے کے طور پر تیار کی گئی ہیں: جعلی ڈیٹا کا استعمال کرتے ہوئے بائیو کیمیکل اسٹڈیز پر بڑے پیمانے پر کاغذات تیار کرنے کی کوشش، اور ان کا ہم مرتبہ جائزہ لینے اور شائع کرنے کی کوشش۔ اس طرح کے کیپر کو نکالا جا سکتا ہے، مثال کے طور پر، ایسے ماہرین تعلیم کو فائدہ پہنچایا جا سکتا ہے جنہیں ان کے منظور شدہ پیپر آؤٹ پٹ کی بنیاد پر معاوضہ دیا جاتا ہے، یا شائع شدہ رپورٹس کے کوٹہ تک پہنچنے میں کسی محکمہ کی مدد کرنے کے لیے۔
"The blots in the example shown in ہمارے اخبار are most likely computer-generated," Christopher told رجسٹر.
میں اکثر جعلی نظر آنے والی تصاویر دیکھتا ہوں، خاص طور پر مغربی دھبے، لیکن تیزی سے مائکروسکوپی تصاویر بھی
"Screening papers both pre- and post-publication, I often come across fake-looking images, predominantly western blots, but increasingly also microscopy images. I am very aware that many of these are most likely generated using GANs."
Elisabeth Bik, a freelance image sleuth, can often tell when images have been manipulated, too. She pores over scientific paper manuscripts, hunting for duplicated images, and flags these issues for journal editors to examine further. But it's harder to combat fake images when they have been comprehensively generated by an algorithm.
She pointed out that although the repeated background in images highlighted in the Byrne and Christopher's study is a telltale sign of forgery, the actual western blots themselves are unique. The computer vision software Bik uses to scan papers and spot image fraud would find it hard to flag these bands because there are no duplications of the actual blots.
"We'll never find an overlap. They're all, I believe, artificially made. How exactly, I'm not sure," she told رجسٹر۔
It's easier to generate fake images with the latest generative AI models
GANs have largely been displaced by diffusion models. These systems generate unique pictures and power today's text-to-image software including DALL-E, Stable Diffusion, and Midjourney. They learn to map the visual representation of objects and concepts to natural language, and could significantly lower the barrier for academic cheating.
Scientists can just describe what type of false data they want generated, and these tools will do it for them. At the moment, however, they can't quite create realistic-looking scientific images yet. Sometimes the tools produce clusters of cells that look convincing at first glance, but fail miserably when it comes to western blots.
یہ اس قسم کی چیز ہے جو یہ AI پروگرام تیار کر سکتے ہیں:
یہاں کیا ہے @OpenAIکا DALL-E حیاتیاتی سیل پرامپٹس کے ساتھ کرتا ہے۔
خاص طور پر: "ایک خوردبین کے نیچے خلیات" اور "ایک سکیننگ الیکٹران مائکروسکوپ کے تحت ٹی سیلز" pic.twitter.com/BgcZr3k5Q5
— تارا باسو ترویدی (@tbt94) اگست 23، 2022
ولیم گبسن - ایک طبیب-سائنس دان اور میڈیکل آنکولوجی فیلو، مشہور مصنف نہیں - اس کی مزید مثالیں ہیں۔ یہاں, including how today's models struggle with the concept of a western blot.
ٹیکنالوجی صرف بہتر ہو رہی ہے، تاہم، کیونکہ ڈویلپرز زیادہ ڈیٹا پر بڑے ماڈلز کو تربیت دیتے ہیں۔
David Bimler, another expert at recognizing image manipulation in science papers, better known as Smut Clyde, told us: "Papermillers will illustrate their products using whatever method is cheapest and fastest, relying on weaknesses in the peer-review process."
"They could simply copy [western blots] from older papers but even that involves work to search through old papers. At the moment, I suspect, using a GAN is still some effort. Though that will change," he added.
DARPA is now looking to expand its SemaFor program to study text-to-image systems. "These kinds of models are fairly new and while in scope, are not part of our current work on SemaFor," Corvey said.
"However, SemaFor evaluators are likely to look at these models during the next evaluation phase of the program beginning Fall 2023."
Meanwhile, the quality of scientific research will erode if academic publishers can't find ways to detect fake AI-generated images in papers. In the best-case scenario, this form of academic fraud will be limited to just paper mill schemes that don't receive much attention anyway. In the worst-case scenario, it will impact even the most reputable journals and scientists with good intentions will waste time and money chasing false ideas they believe to be true. ®
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو بلاک چین۔ Web3 Metaverse Intelligence. علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://go.theregister.com/feed/www.theregister.com/2023/03/11/ai_scientfic_fraud/
- : ہے
- $UP
- 2019
- 2020
- 2021
- 2023
- a
- کی صلاحیت
- تعلیمی
- قابل رسائی
- کے پار
- شامل کیا
- شکست
- ایجنسی
- AI
- یلگورتم
- تمام
- پہلے ہی
- اگرچہ
- تجزیہ کار
- تجزیہ کار کہتے ہیں
- تجزیاتی
- اور
- ایک اور
- ظاہر
- شائع ہوا
- کیا
- AS
- منسلک
- At
- توجہ
- مصنف
- مصنفین
- بچے
- پس منظر
- پس منظر
- رکاوٹ
- کی بنیاد پر
- BE
- کیونکہ
- بننے
- اس سے پہلے
- شروع ہوا
- شروع کریں
- شروع
- کیا جا رہا ہے
- یقین ہے کہ
- مومن
- فائدہ
- BEST
- بہتر
- بایڈیکل
- تعمیر
- by
- کر سکتے ہیں
- صلاحیت رکھتا
- مقدمات
- خلیات
- چیلنجوں
- تبدیل
- سستے
- سب سے سستا
- دھوکہ دہی کی
- کرسٹوفر
- CO
- کی روک تھام
- کس طرح
- تجارتی
- عام طور پر
- کمپنیاں
- معاوضہ
- کمپیوٹر
- کمپیوٹر ویژن
- کمپیوٹر سے تیار کردہ
- تصور
- تصورات
- اندیشہ
- اختتام
- منسلک
- مواد
- سکتا ہے
- تخلیق
- تخلیق
- موجودہ
- dall-e
- دادا
- اعداد و شمار
- deepfakes
- دفاع
- شعبہ
- بیان
- تفصیلات
- ڈویلپرز
- ترقی
- ترقی
- براڈ کاسٹننگ
- بے چینی
- بے گھر
- دور
- کتوں
- کر
- کے دوران
- آسان
- آسانی سے
- کوشش
- کرنڈ
- Ether (ETH)
- تشخیص
- بھی
- سب کچھ
- ثبوت
- بالکل
- مثال کے طور پر
- مثال کے طور پر
- توسیع
- ماہر
- چہرے
- FAIL
- کافی
- جعلی
- گر
- مشہور
- سب سے تیزی سے
- ساتھی
- چند
- اعداد و شمار
- مل
- پہلا
- پرچم
- کے لئے
- فرانزک
- فارنکس
- قائم
- فارم
- ملا
- دھوکہ دہی
- فری لانس
- سے
- فنڈنگ
- مزید
- GANs
- پیدا
- پیدا
- پیدا کرنے والے
- پیداواری
- پیداواری اشتھاراتی نیٹ ورک
- پیداواری AI۔
- جینوم
- حاصل
- حاصل کرنے
- نظر
- جا
- اچھا
- سبز
- ہو
- ہارڈ
- ہے
- مدد
- روشنی ڈالی گئی
- مارو
- کس طرح
- تاہم
- HTTPS
- انسانی
- شکار
- i
- خیالات
- تصویر
- تصاویر
- اثر
- بہتر
- in
- سمیت
- دن بدن
- اشارہ کرتے ہیں
- ابتدائی طور پر
- مثال کے طور پر
- سالمیت
- ارادے
- دلچسپ
- بے شک
- مسائل
- IT
- میں
- جینیفر
- جرنل
- فوٹو
- جانا جاتا ہے
- لیبل
- زمین کی تزئین کی
- زبان
- بڑے پیمانے پر
- بڑے
- مرحوم
- تازہ ترین
- شروع
- جانیں
- سیکھا ہے
- کی طرح
- امکان
- لمیٹڈ
- دیکھو
- کی طرح دیکھو
- تلاش
- بنا
- مینیجر
- جوڑی
- ہیرا پھیری
- بہت سے
- نقشہ
- ماس
- معاملہ
- میکانزم
- میڈیا
- طبی
- میٹا ڈیٹا
- طریقہ
- خوردبین
- درمیانی سفر
- شاید
- ماڈل
- آناخت
- لمحہ
- قیمت
- زیادہ
- سب سے زیادہ
- منتقل
- موسیقی
- قدرتی
- قدرتی زبان
- نیٹ ورک
- نیٹ ورک
- نئی
- اگلے
- NIH
- اشیاء
- of
- پرانا
- on
- اونکولوجی
- ایک
- آپریشن
- دیگر
- خطوط
- پیداوار
- کاغذ.
- کاغذات
- حصہ
- حصے
- گزشتہ
- ساتھی
- مرحلہ
- تصاویر
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- مقبول
- متصور ہوتا ہے
- ممکنہ
- طاقت
- بنیادی طور پر
- کی موجودگی
- پیش
- پریس
- خوبصورت
- پہلے
- شاید
- عمل
- پیدا
- تیار
- حاصل
- ٹیچر
- پروگرام
- پروگرام
- پروٹین
- پروٹوٹائپ
- شائع
- شائع
- پبلیشر
- پبلشرز
- مقاصد
- معیار
- میں تیزی سے
- RE
- اصلی
- حقیقت
- احساس ہوا
- وصول
- ریڈ
- رجسٹر
- بار بار
- رپورٹیں
- نمائندگی
- قابل بھروسہ
- تحقیق
- محققین
- نتائج کی نمائش
- کا جائزہ لینے کے
- -جائزہ لیا
- s
- کہا
- سیم
- اسی
- اسکین
- سکیننگ
- منظر نامے
- مناظر
- منصوبوں
- سائنس
- سائنسی تحقیق
- سائنسدانوں
- گنجائش
- اسکریننگ
- تلاش کریں
- سیکنڈ
- لگ رہا تھا
- semaphore کے
- سیریز
- مقرر
- دکھایا گیا
- شوز
- سائن ان کریں
- نمایاں طور پر
- نشانیاں
- صرف
- بعد
- Sleuth
- سافٹ ویئر کی
- کچھ
- ماخذ
- مخصوص
- ترجمان
- کمرشل
- مستحکم
- شماریات
- ابھی تک
- جدوجہد
- مطالعہ
- مطالعہ
- کامیابی
- اس طرح
- سمجھا
- مشکوک
- سڈنی
- کے نظام
- سسٹمز
- ٹیکنالوجی
- کہ
- ۔
- ان
- ان
- خود
- یہ
- بات
- خطرہ
- کے ذریعے
- وقت
- کرنے کے لئے
- آج
- بھی
- اوزار
- سب سے اوپر
- ٹرین
- سچ
- ٹرننگ
- ٹویٹر
- اقسام
- ہر جگہ موجود
- کے تحت
- منفرد
- یونیورسٹی
- سڈنی یونیورسٹی
- us
- استعمال کی شرائط
- مختلف اقسام کے
- Ve
- نقطہ نظر
- چلنا
- فضلے کے
- طریقوں
- مغربی
- کیا
- جس
- جبکہ
- ڈبلیو
- بڑے پیمانے پر
- گے
- ساتھ
- کام
- گا
- تحریری طور پر
- سال
- زیفیرنیٹ