Черновик:Data mining

Материал из свободной русской энциклопедии «Традиция»
Перейти к навигации Перейти к поиску
Черновик
Исправьте и дополните до полноценной статьи Русской Энциклопедии.

Устойчивое словосочетание английского языка, дословно обозначающее целый спектр значений: добыча и обогащение сырых данных (ОД), металлургия данных (и почему-бы нет алхимия данных - метафора в слабом значении принятая в вычислительной технике).

Отсуствие, пока, адекватного термина на русском языке объясняется отсуствием явления, т.е. пирамиды данных от сверхбольших массивов данных до стратегий национальных баз знаний и технологических программ. (см. ликвидация учёных, кретинизация), так и системы сбора и накопления больших объемов данных.

Технологические аспекты[править | править код]

Нелокальность[править | править код]

Нелокальность является существенным компонентом интеллекта (см. Цехмистро). В случае ОД нелокальность выдвигается на передний край технологии. Обычный процессор выбирает данные словами, длина этого слова может быть от 4 бит простейший контроллер для часов, до динамической длины слов произвольной длины (но в основе все равно остается слово кратное например 128, 256 битам) и пр. В случае нелокальности обрабатывается сразу весь куб данных (точнее сказать многомерный лабиринт символьных данных или многобразие контининтуальных данных). Развиваемые в настоящее время квантовые компьютеры дают надежду создать технологию нелокальных вычислений.

Распознавание образов[править | править код]

Распознавание образов также имеет свою градацию: нижняя граница распознавания графа символов (например шахматный этюд), но нет верхней границы: распознавание интеллектуальная и духовная сфера (лестница Иакова). Например, простейшие нумерологические комбинации могут образовывать сложнейший мироустроительные концепции. (см. нумерология, криптология).

(Анти)Социальные аспекты[править | править код]

Наиболее известная страшилка ОД - незаконный сбор и накопление персональных данных на граждан. Представляется, что возможен вариант полного государственного контроля потока данных личности и манипулирования поведением уже не граждан, а фактически биохиверальных работов.
В спецслужбах имеется большой результативный опыт накопления досье. Но:

  • эти данные накапливаются десятилетиями;
  • жестко локализованы и засекречены;
  • с ними работают квалифицированные сотрудники небольшой численности.

В случае тотальных ОД "сверхсекретные" БД будет продавать на каждом углу, любой Чичиков сможет модифицировать свои данные, в качестве операторов будут работать азербаджанцы (заниматся электронным геноцидом русских) и пр. и пр. Повторение ситуации с разбуханием и деградацией КГБ при Андропове приведшее к развалу СССР.
Скорее можно говорить об обратной тенденции - желании людей делится информацией - социальные сети, свободные (медиа)библиотеки и пр.

Деградация сверху[править | править код]

Еще один аспект: подстраивание организации под руководителя. Т.е. если во главе большой организации, например предоставляющей социальные услуги, стоит поставленный для коррупции кавказец, у которого мухи в голове летают, то однозначно - структура данных будет запутана максимальным образом, и ни о какой ОД, внутри этой организации не может быть и речи. Но этот массив запущенных, хаотичных данных может использовать другая организация, и в другой стране имеющей технологию ОД.

А уж сколько баз данных накопленных в СССР продали за рубеж, и как продажа сопряжена с разрушением БД, и кто сейчас в больших масштабах собирает информацию в России, - это отдельная история.

Искусственный интеллект[править | править код]

Можно попытаться полностью автоматизировать систему с помощью технологии искусственного интеллекта, но в этом случае теряется контроль над системой.

Data Mining и государство[править | править код]

Таким образом государство при радикальном применении ОД не может быть построено, а для разрушения государства это мощное оружие.

Интернет[править | править код]

Литература[править | править код]

  • Graphics of Large Datasets. Visualizing a Million. Antony Unwin, Martin Theus, Heike Hofmann
  • Handbook of Research on Text and Web Mining Technologies. Min Song, Yi-fang Brook Wu
  • Data Mining Practical Machine Learning Tools and Techniques. Ian H. Witten, Eibe Frank
  • Mining the Web: Discovering Knowledge from Hypertext Data. Soumen Chakrabarti
  • Data Mining: Concepts and Techniques. Jiawei Han, Micheline Kamber
  • Introduction to Data Mining and Knowledge Discovery. Two Crows Corporation
  • Data Mining: Concepts, Models, Methods, and Algorithms. Mehmed Kantardzic
  • Data Mining Using Grammar Based Genetic Programming and Applications. Man Leung Wong, Kwong Sak Leung
  • Heuristics and Optimization for Knowledge Discovery. Ruhul A. Sarker, Hussein A. Abbass, Charles S. Newton
  • Managing Data Mining Technologies in Organizations: Techniques and Applications. Parag Pendharkar (ed)
  • Mining graph data. ed. Diane J. Cook, Lawrence B. Holder
  • Tech mining : exploiting new technologies for competitive advantage. Alan L. Porter, Scott W. Cunningham
  • Organizational Data Mining: Leveraging Enterprise Data Resources for Optimal Performance. Namid R. Nemati, Christopher D. Barko (eds)
  • Data Mining. Practical Machine Learning Tools and Techniques. Ian H. Witten, Eibe Frank
  • Data mining using grammar based genetic programming and applications. Man Leung Wong, Kwong Sak Leung
  • Data Mining: A Heuristic Approach. Hussein A. Abbass, Ruhul A. Sarker, Charles S. Newton
  • Data Mining Cookbook. Modeling Data for Marketing, Risk, and Customer Relationship Management. Olivia Parr Rud
  • High Performance Data Mining in Time Series: Techniques and Case Studies. Yunyue Zhu
  • The handbook of data mining. ed. Nong Ye
  • Exploratory Data Mining and Data Cleaning. Tamraparni Dasu, Theodore Johnson
  • Analysis of Survey Data. ed. R. L. Chambers and C. J. Skinner
  • Advanced Data Mining Techniques. David L. Olson, Dursun Delen
  • Discovering knowledge in data. An Introduction to Data Mining. Daniel T. Larose
  • The Data Warehouse ETL Toolkit. Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data. Ralph Kimball, Joe Caserta
  • Mastering Data Warehouse Design. Relational and Dimensional

Techniques. Claudia Imhoff, Nicholas Galemmo, Jonathan G. Geiger

  • The Data Warehouse Toolkit. The Complete Guide to Dimensional. Ralph Kimball, Margy Ross
  • Introduction to Metadata. ed. Murtha Baca
  • Integrating and Extending BIRT. Jason Weathersby, Tom Bondur, Iana Chatalbasheva, Don French
  • BIRT: A Field Guide to Reporting. Diana Peh, Nola Hague, Jane Tatchell
  • Data Mining for Business Applications. ed. Longbing Cao, Philip S. Yu, Chengqi Zhang, Huaifeng Zhang
  • Data Mining Applications for Empowering Knowledge Societies. Hakikur Rahman
  • Symbolic Data Analysis and the SODAS Software. ed. Edwin Diday, Monique Noirhomme-Fraiture
  • Data Mining and Market. Intelligence for Optimal Marketing Returns. Susan Chiu, Domingo Tavella
  • Encyclopedia of Data Warehousing and Mining. John Wang
  • Visual Data Mining. Theory, Techniques and Tools for Visual Analytics. Simeon J. Simoff Michael H. Bühlen, Arturas Mazeika (Eds.)
  • Crystal Reports 10 For Dummies. Allen G.Taylor
  • Data Mining. Theory, Methodology, Techniques, and Applications. eds. Graham J.Williams Simeon J. Simoff
  • Making Sense of Data. A Practical Guide to Exploratory Data Analysis and Data Mining. Glenn J. Myatt
  • Active Mining. New Directions of Data Mining. ed. Hiroshi Motoda
  • Java Data Mining: Strategy, Standard, and Practice. A Practical Guide for Architecture, Design, and Implementation. Mark F. Hornick, Erik Marcadi, Sunil Venkayala
  • Data mining for intelligence, fraud, & criminal detection. Advanced Analytics & Information Sharing Technologies. Christopher Westphal
  • Sequence Data Mining. Guozhu Dong, Jian Pei
  • Введение в OLAP. Алексей Федоров, Наталия Елманова
  • OLAP Solutions Building Multidimensional Information Systems. Erik Thomsen
  • Data Warehouses and OLAP: Concepts, Architectures and Solutions. Robert Wrembel, Christian Koncilia
  • The invisible Web : uncovering information sources search engines can’t see. Chris Sherman and Gary Price
  • Web Analytics for dummies. Pedro Sostre, Jennifer LeClaire
  • Kernel Methods for Pattern Analysis. John Shawe-Taylor, Nello Cristianini
  • Rough – Granular Computing in Knowledge Discovery and Data Mining. Jaroslaw Stepaniuk
  • Soft Computing in Web Information Retrieval. Models and Applications. eds. Enrique Herrera-Viedma, Gabriella Pasi, Fabio Crestani
  • Supervised and Unsupervised Ensemble Methods and their Applications. eds. Oleg Okun, Giorgio Valentini
  • Making sense of data II. A Practical Guide to Data Visualization, Advanced Data Mining Methods, and Applications. Glenn J. Myatt, Wayne P. Johnson
  • Algorithms and Models for theWeb-Graph. International Workshop 2009. eds. Konstantin Avrachenkov. Debora Donato, Nelly Litvak
  • Data Mining and Knowledge Discovery in Real Life Applications. eds. Julio Ponce, Adem Karahoca
  • The top ten algorithms in data mining. ed. Xindong Wu, Vipin Kumar
  • Transfer in Reinforcement Learning Domains. Matthew E. Taylor
  • Data Science and Classification. eds. Vladimir Batagelj a.a.
  • Foundations of Computational Intelligence. Volume 6. Data Mining. Ajith Abraham
  • Toward Category-Level Object Recognition. eds. Jean Ponce, Martial Hebert, Cordelia Schmid, Andrew Zisserman
  • Metalearning. Applications to Data Mining. Pavel Brazdil, Christophe Giraud-Carrier, Carlos Soares Ricardo Vilalta

См. также[править | править код]