добыча данных, в компьютерных науках, процесс обнаружения интересных и полезных закономерностей и взаимосвязей в больших объемах данных. Эта область объединяет инструменты статистики и искусственного интеллекта (такие как нейронные сети и машинное обучение) с управлением базами данных для анализа больших цифровых коллекций, известных как наборы данных. Добыча данных широко используется в бизнесе (страхование, банковское дело, розничная торговля), научных исследованиях (астрономия, медицина) и государственной безопасности (обнаружение преступников и террористов).
Распространение множества крупных и порой взаимосвязанных государственных и частных баз данных привело к появлению нормативных актов, призванных обеспечить точность и защищенность индивидуальных записей от несанкционированного просмотра или фальсификации. Большинство видов анализа данных направлены на получение общих знаний о группе, а не о конкретных людях — супермаркет меньше озабочен тем, чтобы продать еще один товар одному человеку, чем тем, чтобы продать много товаров многим людям, — хотя анализ шаблонов также может использоваться для выявления аномального поведения отдельных людей, например мошенничества или другой преступной деятельности.