ИСКУССТВО ФАЛЬСИФИКАЦИИ ДАННЫХ

Поделиться
Любимый прием, которым Теодор Хилл, профессор математики Технологического института штата Джордж...

Любимый прием, которым Теодор Хилл, профессор математики Технологического института штата Джорджия, (США), привлекает к своему предмету внимание даже самых нерадивых студентов, заключается в предложении попробовать сфальсифицировать результаты 200-кратного подбрасывания монеты. На следующий день профессор, бегло просмотрев длинные последовательности значков, практически безошибочно определяет, кто из студентов добросовестно подбрасывал монеты и фиксировал все результаты, а кто ставил крестики и нолики «от фонаря». Правда, для того, чтобы научиться подобному трюку, самому профессору пришлось подбрасывать монеты десятки тысяч раз, а результаты, полученные в результате такого глубокомысленного занятия, были опубликованы в последнем номере «American Scientist». В своей статье д-р Хилл утверждает, что за 200 подбрасываний обычно обязательно должно выпасть 6-7 орлов или решек подряд, и что ни один нормальный человек не рискнет поставить больше 4-5 одинаковых отметок подряд именно из-за кажущейся неправдоподобности такого «упрямства» монеты.

Фокус с монетами - лишь одно из самых наглядных проявлений действия закона Бенфорда, который все больше специалистов по математической статистике считают мощным инструментом выявления потенциальных фальсификаций или даже просто ошибочных данных. Закон, о котором идет речь, назван по имени Френка Бенфорда, физика, работавшего на General Electric Co. В 1938 году он обратил внимание на то, что страницы таблиц логарифмов, на которых были приведены логифмы чисел, начинающихся с единицы, выглядят гораздо более замусоленными, чем остальные страницы. Д-р Бенфорд почему-то не поверил в то, что числа, начинающиеся с единицы, пользуются каким-то противоестественным расположением физиков и математиков, и предположил, что, скорее всего, такие числа просто гораздо чаще встречаются им в их работе.

Для того, чтобы подтвердить или опровергнуть свою догадку, Бенфорд подверг математическому анализу 20 229 произвольных наборов самых разнообразных чисел. Среди них были площади бассейнов рек, результаты бейсбольных матчей, все числа, которые встречались на первых страницах годовой подшивки The New York Times, номера домов 342 человек, упомянутых в справочнике American Men of Science, и так далее. Во всех без исключения случаях смелая догадка ученого получила блестящее подтверждение: числа, начинающиеся с единицы, составляли приблизительно треть от общего количества всех проанализированных чисел. А ведь по логике они должны были бы встречаться в одном случае из 9!

Бенфорд определил вероятность выпадения цифры d на первом месте любого числа как десятичный логарифм числа

(1 + 1/d). Согласно этой формуле, частота встречаемости числа, начинающегося с 1, составляет 30,1%, с 2 - 17,6%, а, например, с 9 - всего лишь 4,6%. Именно эта закономерность и была названа «законом Бенфорда». При этом выяснилось, что действие этого закона не зависит ни от предмета измерений, ни от величины выборки.

Долгое время этот закон не находил никакого практического применения. Однако недавно им заинтересовался Марк Нигрини, консультант по прикладной математике Канзасского университета. Он предположил, что большинство мошенников вряд ли знакомо с законом Бенфорда, и в любых наборах чисел, претендующих на правдоподобность, частота чисел, начинающихся с единицы, не будет превышать 1/9. Разработке компьютерных программ по выявлению потенциальных случаев фальсификации данных была посвящена его диссертация на соискание степени магистра, и в ходе ее написания он выявил, что человеческая психика тоже отдает некоторое предпочтение «числам, начинающимся с определенных цифр». Правда, на этот раз «любимыми» цифрами оказались 5 и 6. То есть, если любой произвольный набор чисел содержит менее трети чисел, начинающихся с 1, и при этом достаточно много чисел, начинающихся с 5 или 6 - вероятность фальсификации или ошибки достаточно велика.

Работой д-ра Нигрини заинтересовался районный прокурор Бруклина. Математику предложили проанализировать налоговые декларации, среди которых семь были заведомо фальсифицированными. Все они были выделены программой, как требующие тщательного аудита.

С тех пор взаимовыгодное сотрудничество прокуратуры и д-ра Нигрини продолжается и заключается в написании и отработке программ по тестированию любых данных на предмет фальсификации. Теперь такой проверке подвергаются и счета за использование электроэнергии, и квитанции на штрафы за нарушение правил дорожного движения, и многое другое.

Правда, в ходе этого исследования было выявлено два исключения из правила. В первом случае речь идет о выигрышных номерах лотереи. Д-р Нигрини объясняет это тем, что шары, на которых написаны числа, подчиняются законам статистики, действующим в мире единичных предметов, а не чисел. «Это все равно, что писать на шарах клички животных вместо чисел», - утверждает д-р Нигрини. При этом частота выпадения чисел, начинающихся с 1, составляет законные 12%, а не одиозные 30,1%. Вторым исключением действия закона Бенфорда являются отчеты служащих о тратах, совершенных ими во время командировки. По американским правилам расходы на питание, не превышающие сумму в 25 долларов, не требуют подтверждения в виде чеков. Стоит ли удивляться, что самым распространенным числом в этом случае является 24 доллара 90 центов...

Оксана ПРИХОДЬКО

по материалам «International Herald Tribune»

Поделиться
Заметили ошибку?

Пожалуйста, выделите ее мышкой и нажмите Ctrl+Enter или Отправить ошибку

Добавить комментарий
Всего комментариев: 0
Текст содержит недопустимые символы
Осталось символов: 2000
Пожалуйста выберите один или несколько пунктов (до 3 шт.) которые по Вашему мнению определяет этот комментарий.
Пожалуйста выберите один или больше пунктов
Нецензурная лексика, ругань Флуд Нарушение действующего законодательства Украины Оскорбление участников дискуссии Реклама Разжигание розни Признаки троллинга и провокации Другая причина Отмена Отправить жалобу ОК
Оставайтесь в курсе последних событий!
Подписывайтесь на наш канал в Telegram
Следить в Телеграмме