Введение
Предположим, у вас есть книга на тысячу страниц, но на каждой странице есть только одна строка текста. Вы должны извлечь информацию, содержащуюся в книге, с помощью сканера, только этот конкретный сканер систематически просматривает каждую страницу, сканируя один квадратный дюйм за раз. Вам потребуется много времени, чтобы просмотреть всю книгу с помощью этого сканера, и большая часть этого времени будет потрачена впустую на сканирование пустого места.
Такова жизнь многих физиков-экспериментаторов. В экспериментах с частицами детекторы собирают и анализируют огромное количество данных, хотя лишь малая их часть содержит полезную информацию. «На фотографии, скажем, птицы, летящей в небе, каждый пиксель может иметь значение», — пояснил Казухиро Терао, физик Национальной ускорительной лаборатории SLAC. Но на изображениях, на которые смотрит физик, часто действительно имеет значение лишь малая их часть. В таких обстоятельствах тщательное изучение каждой детали напрасно отнимает время и вычислительные ресурсы.
Но это начинает меняться. С помощью инструмента машинного обучения, известного как разреженная сверточная нейронная сеть (SCNN), исследователи могут сосредоточиться на соответствующих частях своих данных и отсеивать остальные. Исследователи использовали эти сети, чтобы значительно ускорить анализ данных в реальном времени. И они планируют использовать SCNN в предстоящих или существующих экспериментах как минимум на трех континентах. Переключение знаменует собой историческое изменение для сообщества физиков.
«В физике мы привыкли разрабатывать собственные алгоритмы и вычислительные подходы, — сказал Карлос Аргуэльес-Дельгадо, физик Гарвардского университета. «Мы всегда были в авангарде развития, но сейчас, в области вычислений, информатика часто лидирует».
Разреженные символы
Работа, которая привела к созданию SCNN, началась в 2012 году, когда Бенджамин Грэм, тогда работавший в Уорикском университете, хотел создать нейронную сеть, которая могла бы распознавать китайский почерк.
Основными инструментами в то время для таких задач, связанных с изображениями, были сверточные нейронные сети (CNN). В задаче китайского почерка писатель обводил иероглиф на цифровом планшете, создавая изображение размером, скажем, в 10,000 3 пикселей. Затем CNN будет перемещать сетку 3 на XNUMX, называемую ядром, по всему изображению, центрируя ядро на каждом пикселе в отдельности. Для каждого размещения ядра сеть будет выполнять сложный математический расчет, называемый сверткой, который ищет отличительные признаки.
CNN были разработаны для использования с информационными изображениями, такими как фотографии. Но изображение, содержащее китайский иероглиф, в основном пусто; исследователи называют данные с этим свойством разреженными. Это общая черта всего в мире природы. «В качестве примера того, насколько разреженным может быть мир, — сказал Грэм, — если бы Эйфелева башня была заключена в наименьший возможный прямоугольник, этот прямоугольник состоял бы из «99.98% воздуха и всего 0.02% железа».
Введение
Грэм попытался настроить подход CNN таким образом, чтобы ядро размещалось только на участках изображения размером 3 на 3, которые содержат хотя бы один пиксель с ненулевым значением (а не просто пустой). Таким образом, ему удалось создать систему, которая могла эффективно идентифицировать рукописный китайский язык. Он выиграл конкурс 2013 года, идентифицируя отдельные символы с частотой ошибок всего 2.61%. (Люди набрали в среднем 4.81 %.) Затем он обратил свое внимание на еще более серьезную проблему: распознавание трехмерных объектов.
К 2017 году Грэм перешел в Facebook AI Research и усовершенствовал свою технику и методы. опубликованный домен подробнее для первой SCNN, которая центрировала ядро только на пикселях с ненулевым значением (вместо того, чтобы размещать ядро на любой секции 3 на 3, в которой был хотя бы один «ненулевой» пиксель). Именно эту общую идею Терао привнес в мир физики элементарных частиц.
Подземные выстрелы
Терао участвует в экспериментах в Национальной ускорительной лаборатории Ферми, которые исследуют природу нейтрино, среди самых неуловимых известных элементарных частиц. Они также являются самыми распространенными частицами во Вселенной с массой (хотя и небольшой), но они редко обнаруживаются внутри детектора. В результате большая часть данных для нейтринных экспериментов скудна, и Терао постоянно искал лучшие подходы к анализу данных. Он нашел один в SCNN.
В 2019 году он применил SCNN для моделирования данных, ожидаемых от Deep Underground Neutrino Experiment, или DUNE, который станет крупнейшим в мире экспериментом по физике нейтрино, когда он будет запущен в 2026 году. через 800 миль земли в подземную лабораторию в Южной Дакоте. По пути частицы будут «колебаться» между тремя известными типами нейтрино, и эти колебания могут выявить подробные свойства нейтрино.
SCNN анализировали смоделированные данные быстрее, чем обычные методы, и для этого требовалось значительно меньше вычислительной мощности. Многообещающие результаты означают, что SCNN, вероятно, будут использоваться во время реального экспериментального запуска.
Тем временем в 2021 году Терао помог добавить SCNN в другой нейтринный эксперимент в Fermilab, известный как MicroBooNE. Здесь ученые смотрят на последствия столкновений нейтрино с ядрами атомов аргона. Изучая следы, созданные этими взаимодействиями, исследователи могут сделать выводы об исходных нейтрино. Для этого им нужен алгоритм, который может рассматривать пиксели (или, технически, их трехмерные аналоги, называемые вокселами) в трехмерном представлении детектора, а затем определять, какие пиксели связаны с какими траекториями частиц.
Поскольку данных очень мало — небольшое количество крошечных линий внутри большого детектора (примерно 170 тонн жидкого аргона) — SCNN почти идеально подходят для этой задачи. По словам Терао, со стандартной CNN изображение пришлось бы разбить на 50 частей из-за необходимости выполнения всех вычислений. «С разреженной CNN мы анализируем все изображение сразу — и делаем это намного быстрее».
Своевременные триггеры
Одним из исследователей, работавших над MicroBooNE, был студент-стажер по имени Феликс Ю. Впечатленный мощностью и эффективностью SCNN, он взял инструменты с собой на свое следующее рабочее место в качестве аспиранта Гарвардской исследовательской лаборатории, официально связанной с нейтринной обсерваторией IceCube на Южном полюсе.
Одной из ключевых целей обсерватории является перехват самых энергичных нейтрино во Вселенной и отслеживание их источников, большинство из которых находится за пределами нашей галактики. Детектор состоит из 5,160 оптических датчиков, закопанных в антарктический лед, и лишь малая часть из них загорается в любой момент времени. Остальная часть массива остается темной и не особенно информативной. Хуже того, многие «события», которые регистрируют детекторы, являются ложными срабатываниями и бесполезны для охоты за нейтрино. Только так называемые триггерные события подлежат дальнейшему анализу, и необходимо принимать мгновенные решения относительно того, какие из них достойны этого обозначения, а какие будут постоянно игнорироваться.
Стандартные CNN слишком медленны для этой задачи, поэтому ученые IceCube долгое время полагались на алгоритм под названием LineFit, чтобы сообщать им о потенциально полезных обнаружениях. Но этот алгоритм ненадежен, сказал Ю, «а это значит, что мы можем упустить интересные события». Опять же, это среда разреженных данных, идеально подходящая для SCNN.
Ю — вместе с Аргуэльесом-Дельгадо, его научным руководителем, и Джеффом Лазаром, аспирантом Висконсинского университета в Мэдисоне — количественно оценили это преимущество, показав в недавняя статья что эти сети будут примерно в 20 раз быстрее, чем типичные CNN. «Этого достаточно, чтобы обрабатывать каждое событие, поступающее от детектора», — сказал Лазар, около 3,000 событий в секунду. «Это позволяет нам принимать более взвешенные решения о том, что выбросить, а что оставить».
Введение
Авторы также успешно использовали SCNN в моделировании с использованием официальных данных IceCube, и следующим шагом является тестирование их системы на реплике вычислительной системы Южного полюса. Если все пойдет хорошо, Аргуэльес-Дельгадо считает, что в следующем году они должны установить свою систему в антарктической обсерватории. Но технология может найти еще более широкое применение. «Мы думаем, что [SCNN могут принести пользу] всем нейтринным телескопам, а не только IceCube», — сказал Аргуэльес-Дельгадо.
Помимо нейтрино
Филип Харрис, физик из Массачусетского технологического института, надеется, что SCNN смогут помочь в самом большом из всех коллайдеров частиц: Большом адронном коллайдере (БАК) в ЦЕРНе. Харрис услышал об этом типе нейронной сети от коллеги из Массачусетского технологического института, ученого-компьютерщика Сонга Хана. «Сонг — эксперт по созданию быстрых и эффективных алгоритмов, — сказал Харрис, — идеально подходит для БАК, где каждую секунду происходит 40 миллионов столкновений.
Когда они разговаривали пару лет назад, Сонг рассказал Харрису о проекте автономных транспортных средств, над которым он работал вместе с сотрудниками своей лаборатории. Команда Сонга использовала SCNN для анализа трехмерных лазерных карт пространства перед автомобилем, большая часть которого пуста, чтобы увидеть, нет ли впереди каких-либо препятствий.
Харрис и его коллеги сталкиваются с аналогичными проблемами на БАК. Когда два протона сталкиваются внутри машины, при столкновении создается расширяющаяся сфера из частиц. Когда одна из этих частиц попадает на коллектор, возникает ливень вторичных частиц. «Если вы сможете наметить всю протяженность этого потока, — сказал Харрис, — вы сможете определить энергию частицы, которая его породила», что может представлять особый интерес — что-то вроде бозона Хиггса, который физики открытая в 2012 году, или частица темной материи, которую физики все еще ищут.
«Проблема, которую мы пытаемся решить, сводится к соединению точек», — сказал Харрис, точно так же, как беспилотный автомобиль может соединять точки лазерной карты для обнаружения препятствия.
По словам Харриса, SCNN ускорят анализ данных на LHC как минимум в 50 раз. «Наша конечная цель — ввести [SCNN] в детектор» — задача, которая потребует не менее года бумажной работы и дополнительной поддержки со стороны сообщества. Но он и его коллеги полны надежд.
В целом становится все более вероятным, что SCNN — идея, первоначально зародившаяся в мире компьютерных наук, — вскоре сыграют роль в крупнейших экспериментах, когда-либо проводившихся в нейтринной физике (DUNE), нейтринной астрономии (IceCube) и физике высоких энергий (БАК). .
Грэм сказал, что был приятно удивлен, узнав, что SCNN пробились в физику элементарных частиц, хотя он не был полностью шокирован. «В абстрактном смысле, — сказал он, — частица, движущаяся в пространстве, немного похожа на кончик пера, движущийся по листу бумаги».
- SEO-контент и PR-распределение. Получите усиление сегодня.
- ЭВМ Финанс. Единый интерфейс для децентрализованных финансов. Доступ здесь.
- Квантум Медиа Групп. ИК/PR усиление. Доступ здесь.
- ПлатонАйСтрим. Анализ данных Web3. Расширение знаний. Доступ здесь.
- Источник: https://www.quantamagazine.org/sparse-neural-networks-point-physicists-to-useful-data-20230608/
- :имеет
- :является
- :нет
- :куда
- ][п
- $UP
- 000
- 10
- 20
- 2012
- 2013
- 2017
- 2019
- 2021
- 2026
- 3d
- 40
- 50
- a
- способность
- О нас
- АБСТРАКТ НАЯ
- обильный
- ускорять
- ускоритель
- через
- фактического соединения
- на самом деле
- Добавить
- дополнительный
- плюс
- Аффилированные
- последствия
- снова
- тому назад
- впереди
- AI
- ай исследование
- AIR
- алгоритм
- алгоритмы
- Все
- вдоль
- причислены
- всегда
- среди
- суммы
- an
- анализ
- анализировать
- и
- Другой
- любой
- все
- прикладной
- подхода
- подходы
- примерно
- МЫ
- массив
- AS
- связанный
- астрономия
- At
- внимание
- Авторы
- в среднем
- назад
- BE
- , так как:
- было
- начал
- считает,
- польза
- Лучшая
- между
- больший
- Крупнейшая
- птица
- Немного
- пустой
- книга
- бозон
- Сломанный
- принес
- но
- by
- под названием
- CAN
- захватить
- автомобиль
- центр
- центрирование
- CERN
- проблемы
- изменение
- персонаж
- символы
- Чикаго
- китайский
- обстоятельства
- CNN
- коллега
- коллеги
- коллектор
- сталкиваться
- выходит
- Общий
- сообщество
- конкурс
- сложный
- Состоит
- вычисление
- вычислительная мощность
- компьютер
- Информатика
- вычисление
- понятый
- проводятся
- Свяжитесь
- Соединительный
- постоянно
- содержащегося
- содержит
- сверточная нейронная сеть
- может
- Пара
- Crash
- создали
- создает
- Порез
- Дакота
- темно
- Темная материя
- данным
- анализ данных
- решения
- глубоко
- обозначение
- предназначенный
- подробность
- подробный
- подробнее
- Определять
- развивающийся
- Развитие
- Интернет
- открытый
- do
- дело
- сделанный
- вниз
- дюна
- в течение
- каждый
- земля
- затрат
- эффективный
- эффективно
- занятых
- позволяет
- конец
- энергетика
- достаточно
- Весь
- Окружающая среда
- ошибка
- Даже
- События
- События
- НИКОГДА
- Каждая
- Изучение
- пример
- существующий
- расширяющийся
- ожидаемый
- эксперимент
- Эксперименты
- эксперту
- объяснены
- степень
- извлечение
- Face
- что его цель
- фактор
- ложный
- БЫСТРО
- быстрее
- Особенность
- Особенности
- Во-первых,
- полет
- Фокус
- Что касается
- Передний край
- Формально
- найденный
- доля
- от
- передний
- полный
- далее
- Galaxy
- Общие
- получить
- Дайте
- данный
- цель
- Цели
- идет
- выпускник
- сетка
- было
- Гарвардский
- Гарвардский университет
- Есть
- he
- услышанный
- помощь
- помог
- здесь
- его
- его
- исторический
- Хиты
- надежды
- надеясь
- Как
- HTTPS
- Людей
- охота
- ICE
- идея
- определения
- идентифицирующий
- if
- изображение
- изображений
- впечатленный
- in
- все больше и больше
- individual
- в отдельности
- информация
- информативный
- мгновение
- Институт
- взаимодействие
- интерес
- интересный
- в
- вовлеченный
- IT
- всего
- Сохранить
- Основные
- Вид
- известный
- лаборатория
- лаборатория
- большой
- крупнейших
- лазер
- вести
- ведущий
- УЧИТЬСЯ
- изучение
- наименее
- Меньше
- ЖИЗНЬЮ
- легкий
- такое как
- Вероятно
- линия
- линий
- жидкость
- Длинное
- много времени
- посмотреть
- смотрел
- ВЗГЛЯДЫ
- машина
- обучение с помощью машины
- сделанный
- журнал
- сделать
- Создание
- многих
- карта
- Карты
- Масса
- Массачусетс
- Массачусетский Технологический Институт
- математический
- Вопрос
- Вопросы
- Май..
- значить
- значимым
- означает
- Между тем
- Участники
- методы
- может быть
- миллиона
- отсутствующий
- MIT
- самых
- в основном
- двигаться
- переехал
- перемещение
- много
- Названный
- национальный
- натуральный
- природа
- Необходимость
- сеть
- сетей
- нервный
- нейронной сети
- нейронные сети
- нейтрино
- следующий
- сейчас
- объект
- обсерватория
- происходить
- of
- Официальный представитель в Грузии
- .
- on
- консолидировать
- ONE
- те,
- онлайн
- только
- or
- обычный
- оригинал
- первоначально
- наши
- внешний
- внешнюю
- за
- собственный
- страница
- бумага & картон
- оформление документации
- частица
- особый
- особенно
- части
- ИДЕАЛЬНОЕ
- выполнять
- постоянно
- фотографии
- Физика
- кусок
- штук
- Pixel
- размещение
- план
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- Играть
- Точка
- возможное
- потенциально
- мощностью
- премьер-министр
- зонд
- Проблема
- Проект
- многообещающий
- свойства
- собственность
- протоны
- Обменный курс
- скорее
- реального времени
- данные в реальном времени
- последний
- признание
- признавать
- запись
- рафинированный
- соответствующие
- остатки
- ответ
- представление
- обязательный
- исследованиям
- исследователи
- Полезные ресурсы
- ОТДЫХ
- результат
- Итоги
- показывать
- Рост
- Роли
- Run
- Сказал
- сообщили
- сканирование
- Наука
- Ученый
- Ученые
- экран
- поиск
- Во-вторых
- вторичный
- Раздел
- разделах
- посмотреть
- самостоятельное вождение
- автомобиль с автоматическим управлением
- смысл
- датчик
- потрясенный
- стрелять
- должен
- показывать
- показ
- существенно
- аналогичный
- моделирование
- одинарной
- небо
- медленной
- небольшой
- So
- РЕШАТЬ
- удалось
- песня
- Скоро
- Источники
- Южная
- Space
- особый
- скорость
- площадь
- стандарт
- Стэнфорд
- Начало
- Шаг
- По-прежнему
- "Студент"
- Успешно
- такие
- предполагаемый
- удивлен
- Коммутатор
- система
- таблетка
- взять
- Сложность задачи
- задачи
- команда
- технически
- Технологии
- телескоп
- сказать
- тестXNUMX
- чем
- который
- Ассоциация
- информация
- мир
- их
- Их
- тогда
- Там.
- Эти
- они
- вещи
- think
- этой
- хоть?
- три
- трехмерный
- Через
- время
- раз
- тип
- в
- Тон
- слишком
- инструментом
- инструменты
- ПОЛНОСТЬЮ
- Башня
- прослеживать
- пыталась
- Оказалось
- доводка
- два
- Типы
- типичный
- окончательный
- Вселенная
- Университет
- Предстоящие
- us
- использование
- используемый
- Полезная информация
- через
- ценностное
- Огромная
- автомобиль
- Воксели
- стремятся
- законопроект
- Путь..
- we
- WebP
- ЧТО Ж
- были
- Что
- когда
- который
- КТО
- все
- Шире
- будете
- Висконсин
- в
- Выиграл
- Работа
- работавший
- Рабочее место
- Мир
- мире
- хуже
- бы
- писатель
- год
- лет
- являетесь
- зефирнет