Метод підрахунку без підрахунку: як оцінити кількість об'єктів


Математики розробили спосіб визначення кількості рухомих об'єктів без необхідності рахувати кожен окремо

Зображення New Scientist
Зображення New Scientist

Підрахунок рухомих об'єктів завжди становив складність для дослідників та аналітиків. Чи то ворожі танки на полі бою, тварини в дикій природі або столові прибори в жвавій їдальні — усі ці об'єкти важко порахувати через їхню постійну рухливість. Проте математики знайшли елегантне рішення цієї проблеми, розробивши техніку, яка дозволяє оцінити кількість чогось без необхідності рахувати кожен окремий екземпляр.

Метод захоплення-повторного захоплення полягає в отриманні зразка об'єктів. Наприклад, дослідники чекають, поки повз них пройдуть деякі тварини, потім збирають частину з них, позначають кожну особину характерним способом і випускають назад до популяції. Після певного проміжку часу процес повторюється — збирається нова група тварин і підраховується, скільки з них уже мають позначки.

Принцип роботи методу досить простий. Якщо спочатку було зловлено п'ятдесят тварин і всі вони були позначені, а під час повторного захоплення виявилося, що половина побачених тварин має позначки, це дає важливу інформацію про всю популяцію. Оскільки половина зразка позначена, це означає, що половина всієї популяції також позначена. Отже, загальна кількість особин має становити приблизно сто. Такий підхід дозволяє отримати досить точну оцінку популяції без необхідності знаходити та рахувати кожного її представника.

Під час Другої світової війни союзні статистики зіткнулися з необхідністю визначити, скільки танків виробляє німецька армія. Захоплені танки неможливо було випустити назад, але компоненти танків мали серійні номери, що дозволило застосувати інший підхід для оцінки. Аналітики записували серійні номери всіх захоплених або знищених танків, виходячи з припущення, що вони нумерувалися послідовно та розподілялися випадково.

Якщо найбільший серійний номер у даних дорівнює L, а кількість захоплених танків становить n, то одна з оцінок загальної кількості танків визначається формулою L плюс L поділене на n. Наприклад, якщо є чотири номери, найбільший з яких дорівнює вісімдесят, можна припустити, що весь діапазон продовжується ще приблизно на вісімдесят поділене на чотири, тобто на двадцять, отже загалом має бути близько ста танків. Ця задача відома в статистиці як німецька танкова проблема.

Одна з найцікавіших історій про оцінку популяції була розказана вчителькою, яка поставила своїм учням завдання оцінити кількість виделок у шкільній їдальні. Підрахувати їх було неможливо, оскільки в будь-який момент частина виделок використовується, а інші перебувають у мийці. Клас захопив набір виделок і позначив кожну краплею лаку для нігтів, потім випустив їх назад до загальної кількості. Через тиждень учні повторно захопили іншу вибірку та використали її для оцінки загальної кількості виделок.

Дослідники провели подібний експеримент двадцять років тому. У їхній лабораторії зникала тривожна кількість чайних ложок, тому вони позначили набір ложок перед тим, як випустити їх назад, вивчили їхні переміщення та опублікували результати. Виявилося, що наука дійсно ефективна — публікація статті призвела до того, що п'ять чайних ложок було соромливо повернуто викрадачами ложок у будівлі.

Метод захоплення-повторного захоплення знайшов широке застосування в різних галузях науки. Біологи використовують його для оцінки чисельності популяцій диких тварин, особливо тих видів, які важко спостерігати безпосередньо. Екологи застосовують цю техніку для моніторингу стану екосистем та відстеження змін у біорізноманітті. Соціологи адаптували метод для оцінки розміру прихованих популяцій людей, таких як бездомні або люди з певними захворюваннями.

Точність методу залежить від кількох важливих припущень. По-перше, популяція має залишатися відносно стабільною між періодами захоплення — не повинно бути значних народжень, смертей або міграцій. По-друге, позначені особини мають змішуватися з непозначеними випадковим чином. По-третє, позначки не повинні впливати на поведінку або виживання особин. По-четверте, ймовірність захоплення має бути однаковою для всіх особин у популяції.

Математична основа методу ґрунтується на пропорції. Якщо M — кількість позначених особин у першому захопленні, C — загальна кількість особин у другому захопленні, а R — кількість позначених особин у другому захопленні, то загальна популяція N може бути оцінена як N дорівнює M помножене на C і поділене на R.

Сучасні дослідники розробили більш складні варіанти базового методу. Метод Лінкольна-Петерсена враховує можливі похибки у вимірюваннях. Метод Джоллі-Себера дозволяє працювати з популяціями, що змінюються в часі. Байєсівські підходи включають попередні знання про популяцію для покращення точності оцінок.

Технологічні досягнення відкрили нові можливості для застосування принципів захоплення-повторного захоплення. Фотопастки з розпізнаванням зображень дозволяють ідентифікувати тварин за природними позначками, такими як плями або смуги. Генетичне секвенування надає можливість використовувати ДНК як унікальні позначки. Супутникове відстеження та радіомітки розширюють можливості моніторингу великих тварин на значних територіях.

Метод також знаходить застосування в цифровому світі. Програмісти використовують подібні принципи для оцінки кількості помилок у програмному коді. Маркетологи застосовують варіації методу для оцінки охоплення рекламних кампаній. Епідеміологи адаптують техніку для відстеження поширення захворювань у популяціях.

Попри свою простоту, метод захоплення-повторного захоплення залишається потужним інструментом сучасної науки. Він демонструє, як математичні принципи можуть надати практичні рішення для складних проблем реального світу. Від підрахунку зникаючих видів до оцінки військового потенціалу противника, цей метод продовжує служити дослідникам у найрізноманітніших сферах діяльності.

— За матеріалами New Scientist