Школяр за допомогою ШІ виявив 1.5 млн невідомих об'єктів у космосі


Американський школяр Маттео Паз, працюючи над проєктом у Калтеху, розробив новий ШІ-алгоритм та виявив 1.5 млн раніше невідомих космічних об'єктів у даних телескопа NASA NEOWISE.

Зображення California Institute of Technology
Зображення California Institute of Technology

У світі сучасної науки відкриття часто є результатом роботи великих команд та використання складного обладнання. Однак історія Маттео (Метью) Паза, учня старших класів зі США, доводить, що поєднання допитливості, таланту, якісного наставництва та потужних інструментів, таких як штучний інтелект (ШІ), може призвести до проривних результатів навіть у юному віці. Працюючи над дослідницьким проєктом у престижному Каліфорнійському технологічному інституті (Калтех), Паз не лише розробив новий алгоритм машинного навчання, але й за його допомогою виявив приголомшливу кількість — 1.5 мільйона — раніше невідомих об'єктів у космосі, розширив науковий потенціал космічної місії NASA та опублікував наукову статтю як єдиний автор у впливовому виданні The Astronomical Journal.

Шлях Маттео до астрономії розпочався ще в початковій школі, коли мати приводила його на публічні лекції зі спостереження за зірками в Калтеху. Цей ранній інтерес переріс у серйозне захоплення. Влітку 2022 року він отримав можливість поглибити свої знання, взявши участь у програмі Caltech Planet Finder Academy, яку очолює професор астрономії Ендрю Говард. Ця програма дає талановитим школярам змогу зануритися в астрономію та пов'язані з нею комп'ютерні науки. Ключову роль у його успіху відіграв наставник — Деві Кіркпатрік, досвідчений астроном та старший науковий співробітник IPAC (Центру обробки та аналізу інфрачервоних даних) при Калтеху.

«Мені неймовірно пощастило зустріти Деві, — розповідає Паз. — Пам'ятаю, як у перший день нашої розмови я сказав, що розглядаю можливість написати наукову статтю за результатами роботи, що було значно амбітнішою метою для шеститижневої програми. Він не став мене відмовляти, а сказав: „Гаразд, давай це обговоримо“. Він дозволив мені навчатися без обмежень. Гадаю, саме тому я так сильно виріс як науковець». Сам Кіркпатрік, вирісши у фермерській громаді в Теннессі, здійснив свою мрію стати астрономом завдяки підтримці своєї вчительки хімії та фізики у дев'ятому класі. «Я хотів передати такий самий досвід наставництва комусь іншому, і, сподіваюся, багатьом іншим, — каже Кіркпатрік. — Якщо я бачу їхній потенціал, я хочу переконатися, що вони його реалізують. Я зроблю все можливе, щоб їм допомогти».

Водночас Кіркпатрік прагнув отримати більше наукової інформації з даних місії NEOWISE (Near-Earth Object Wide-field Infrared Survey Explorer) — інфрачервоного космічного телескопа NASA, який вже завершив свою роботу. Понад 10 років NEOWISE сканував усе небо в пошуках астероїдів та інших об'єктів поблизу Землі. Однак, спостерігаючи за астероїдами, телескоп також фіксував інфрачервоне випромінювання (тепло) від безлічі інших, більш віддалених космічних об'єктів, яскравість яких змінювалася з часом: вони могли інтенсивно спалахувати, пульсувати або тьмяніти під час затемнення. Астрономи називають такі об'єкти змінними. До них належать такі важкодоступні для вивчення явища, як квазари (надмасивні чорні діри в центрах далеких галактик), зорі, що вибухають (наднові), та подвійні зорі, що періодично затьмарюють одна одну.

Величезний масив даних про ці змінні об'єкти, зібраний NEOWISE, залишався значною мірою неопрацьованим. Якби команда NEOWISE змогла ідентифікувати ці об'єкти та зробити їх доступними для астрономічної спільноти, отриманий каталог міг би дати безцінне уявлення про те, як різноманітні космічні об'єкти змінюються протягом років. Проблема полягала в масштабі даних. «На той момент таблиця з усіма окремими детектуваннями, зробленими за понад десять років, наближалася до 200 мільярдів рядків», — пояснює Кіркпатрік. Його початкова ідея для літнього проєкту Паза була скромною: взяти невелику ділянку неба і спробувати знайти кілька змінних зір вручну, щоб потім показати потенціал всього набору даних.

Однак Маттео Паз не мав наміру просіювати дані вручну. Його шкільна підготовка дала йому інший погляд на проблему. Він зацікавився штучним інтелектом під час факультативного курсу, який поєднував програмування, теоретичну інформатику та формальну математику. Паз знав, що ШІ найкраще навчається на великих, упорядкованих наборах даних, подібних до того, що надав йому Кіркпатрік. Крім того, він володів глибокими знаннями з математики, необхідними для програмування на високому рівні: він вже вивчав математику рівня старших курсів університету в рамках спеціалізованої програми Math Academy в Пасадені, де учні завершують курс AP Calculus BC (вищий рівень математичного аналізу) ще у восьмому класі.

Тож Паз взявся за розробку методу машинного навчання для аналізу всього набору даних NEOWISE та виявлення потенційних змінних об'єктів. За шість тижнів літньої програми він почав створювати модель ШІ, яка відразу показала перспективні результати. Паралельно він консультувався з Кіркпатріком, вивчаючи необхідні аспекти астрономії та астрофізики. «Кожна зустріч з Деві — це 10% роботи і 90% просто розмов, — каже Паз. — Було надзвичайно круто просто мати когось, з ким можна так поговорити про науку». Кіркпатрік також познайомив Паза з іншими астрономами Калтеху, які поділилися своїм досвідом у застосуванні методів машинного навчання в астрономії та у вивченні об'єктів, що змінюються на коротких і довгих часових проміжках. Вони з'ясували, що специфічний ритм спостережень NEOWISE ускладнював систематичне виявлення та класифікацію багатьох об'єктів, які або спалахували один раз дуже швидко, або змінювалися поступово протягом тривалого часу.

Літо закінчилося, але робота тривала. У 2024 році Паз і Кіркпатрік знову співпрацювали, і цього разу Паз вже сам виступав у ролі наставника для інших школярів. Він доопрацював свою модель ШІ для обробки всіх необроблених даних спостережень NEOWISE та проаналізував результати. Навчені розпізнавати найдрібніші відмінності в інфрачервоних вимірах телескопа, алгоритми виявили та класифікували 1.5 мільйона потенційно нових змінних об'єктів. У 2025 році Паз та Кіркпатрік планують опублікувати повний каталог об'єктів, яскравість яких значно змінювалася в даних NEOWISE, надавши астрономічній спільноті цінний ресурс для подальших досліджень.

Розроблений Пазом алгоритм, що базується на методах Фур'є- та вейвлет-аналізу, має потенціал застосування далеко за межами астрономії. «Модель, яку я реалізував, може бути використана для інших досліджень часових рядів в астрономії, і потенційно для будь-чого іншого, що має часовий формат», — пояснює Паз. «Я бачу певну релевантність для аналізу графіків [фондового ринку], де інформація так само надходить у вигляді часових рядів, а періодичні компоненти можуть бути критично важливими. Також можна вивчати атмосферні ефекти, такі як забруднення, де періодичні сезони та добові цикли відіграють величезну роль».

Зараз, ще навчаючись у старшій школі, Маттео Паз вже є офіційним співробітником Калтеху. Він працює під керівництвом Кіркпатріка в IPAC — центрі, який керує, обробляє, архівує та аналізує дані не лише NEOWISE, але й кількох інших космічних місій, що підтримуються NASA та Національним науковим фондом США (NSF). Це перша оплачувана робота талановитого юнака, чиє відкриття демонструє величезний потенціал поєднання людського інтелекту, штучного інтелекту та якісного наставництва у розширенні меж наукового пізнання.

— За матеріалами Phys.org