Черновик:Data mining
Черновик Исправьте и дополните до полноценной статьи Русской Энциклопедии. |
Устойчивое словосочетание английского языка, дословно обозначающее целый спектр значений: добыча и обогащение сырых данных (ОД), металлургия данных (и почему-бы нет алхимия данных - метафора в слабом значении принятая в вычислительной технике).
Отсуствие, пока, адекватного термина на русском языке объясняется отсуствием явления, т.е. пирамиды данных от сверхбольших массивов данных до стратегий национальных баз знаний и технологических программ. (см. ликвидация учёных, кретинизация), так и системы сбора и накопления больших объемов данных.
Технологические аспекты[править | править код]
Нелокальность[править | править код]
Нелокальность является существенным компонентом интеллекта (см. Цехмистро). В случае ОД нелокальность выдвигается на передний край технологии. Обычный процессор выбирает данные словами, длина этого слова может быть от 4 бит простейший контроллер для часов, до динамической длины слов произвольной длины (но в основе все равно остается слово кратное например 128, 256 битам) и пр. В случае нелокальности обрабатывается сразу весь куб данных (точнее сказать многомерный лабиринт символьных данных или многобразие контининтуальных данных). Развиваемые в настоящее время квантовые компьютеры дают надежду создать технологию нелокальных вычислений.
Распознавание образов[править | править код]
Распознавание образов также имеет свою градацию: нижняя граница распознавания графа символов (например шахматный этюд), но нет верхней границы: распознавание интеллектуальная и духовная сфера (лестница Иакова). Например, простейшие нумерологические комбинации могут образовывать сложнейший мироустроительные концепции. (см. нумерология, криптология).
(Анти)Социальные аспекты[править | править код]
Наиболее известная страшилка ОД - незаконный сбор и накопление персональных данных на граждан. Представляется, что возможен вариант полного государственного контроля потока данных личности и манипулирования поведением уже не граждан, а фактически биохиверальных работов.
В спецслужбах имеется большой результативный опыт накопления досье. Но:
- эти данные накапливаются десятилетиями;
- жестко локализованы и засекречены;
- с ними работают квалифицированные сотрудники небольшой численности.
В случае тотальных ОД "сверхсекретные" БД будет продавать на каждом углу, любой Чичиков сможет модифицировать свои данные, в качестве операторов будут работать азербаджанцы (заниматся электронным геноцидом русских) и пр. и пр. Повторение ситуации с разбуханием и деградацией КГБ при Андропове приведшее к развалу СССР.
Скорее можно говорить об обратной тенденции - желании людей делится информацией - социальные сети, свободные (медиа)библиотеки и пр.
Деградация сверху[править | править код]
Еще один аспект: подстраивание организации под руководителя. Т.е. если во главе большой организации, например предоставляющей социальные услуги, стоит поставленный для коррупции кавказец, у которого мухи в голове летают, то однозначно - структура данных будет запутана максимальным образом, и ни о какой ОД, внутри этой организации не может быть и речи. Но этот массив запущенных, хаотичных данных может использовать другая организация, и в другой стране имеющей технологию ОД.
А уж сколько баз данных накопленных в СССР продали за рубеж, и как продажа сопряжена с разрушением БД, и кто сейчас в больших масштабах собирает информацию в России, - это отдельная история.
Искусственный интеллект[править | править код]
Можно попытаться полностью автоматизировать систему с помощью технологии искусственного интеллекта, но в этом случае теряется контроль над системой.
Data Mining и государство[править | править код]
Таким образом государство при радикальном применении ОД не может быть построено, а для разрушения государства это мощное оружие.
Интернет[править | править код]
Литература[править | править код]
- Graphics of Large Datasets. Visualizing a Million. Antony Unwin, Martin Theus, Heike Hofmann
- Handbook of Research on Text and Web Mining Technologies. Min Song, Yi-fang Brook Wu
- Data Mining Practical Machine Learning Tools and Techniques. Ian H. Witten, Eibe Frank
- Mining the Web: Discovering Knowledge from Hypertext Data. Soumen Chakrabarti
- Data Mining: Concepts and Techniques. Jiawei Han, Micheline Kamber
- Introduction to Data Mining and Knowledge Discovery. Two Crows Corporation
- Data Mining: Concepts, Models, Methods, and Algorithms. Mehmed Kantardzic
- Data Mining Using Grammar Based Genetic Programming and Applications. Man Leung Wong, Kwong Sak Leung
- Heuristics and Optimization for Knowledge Discovery. Ruhul A. Sarker, Hussein A. Abbass, Charles S. Newton
- Managing Data Mining Technologies in Organizations: Techniques and Applications. Parag Pendharkar (ed)
- Mining graph data. ed. Diane J. Cook, Lawrence B. Holder
- Tech mining : exploiting new technologies for competitive advantage. Alan L. Porter, Scott W. Cunningham
- Organizational Data Mining: Leveraging Enterprise Data Resources for Optimal Performance. Namid R. Nemati, Christopher D. Barko (eds)
- Data Mining. Practical Machine Learning Tools and Techniques. Ian H. Witten, Eibe Frank
- Data mining using grammar based genetic programming and applications. Man Leung Wong, Kwong Sak Leung
- Data Mining: A Heuristic Approach. Hussein A. Abbass, Ruhul A. Sarker, Charles S. Newton
- Data Mining Cookbook. Modeling Data for Marketing, Risk, and Customer Relationship Management. Olivia Parr Rud
- High Performance Data Mining in Time Series: Techniques and Case Studies. Yunyue Zhu
- The handbook of data mining. ed. Nong Ye
- Exploratory Data Mining and Data Cleaning. Tamraparni Dasu, Theodore Johnson
- Analysis of Survey Data. ed. R. L. Chambers and C. J. Skinner
- Advanced Data Mining Techniques. David L. Olson, Dursun Delen
- Discovering knowledge in data. An Introduction to Data Mining. Daniel T. Larose
- The Data Warehouse ETL Toolkit. Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data. Ralph Kimball, Joe Caserta
- Mastering Data Warehouse Design. Relational and Dimensional
Techniques. Claudia Imhoff, Nicholas Galemmo, Jonathan G. Geiger
- The Data Warehouse Toolkit. The Complete Guide to Dimensional. Ralph Kimball, Margy Ross
- Introduction to Metadata. ed. Murtha Baca
- Integrating and Extending BIRT. Jason Weathersby, Tom Bondur, Iana Chatalbasheva, Don French
- BIRT: A Field Guide to Reporting. Diana Peh, Nola Hague, Jane Tatchell
- Data Mining for Business Applications. ed. Longbing Cao, Philip S. Yu, Chengqi Zhang, Huaifeng Zhang
- Data Mining Applications for Empowering Knowledge Societies. Hakikur Rahman
- Symbolic Data Analysis and the SODAS Software. ed. Edwin Diday, Monique Noirhomme-Fraiture
- Data Mining and Market. Intelligence for Optimal Marketing Returns. Susan Chiu, Domingo Tavella
- Encyclopedia of Data Warehousing and Mining. John Wang
- Visual Data Mining. Theory, Techniques and Tools for Visual Analytics. Simeon J. Simoff Michael H. Bühlen, Arturas Mazeika (Eds.)
- Crystal Reports 10 For Dummies. Allen G.Taylor
- Data Mining. Theory, Methodology, Techniques, and Applications. eds. Graham J.Williams Simeon J. Simoff
- Making Sense of Data. A Practical Guide to Exploratory Data Analysis and Data Mining. Glenn J. Myatt
- Active Mining. New Directions of Data Mining. ed. Hiroshi Motoda
- Java Data Mining: Strategy, Standard, and Practice. A Practical Guide for Architecture, Design, and Implementation. Mark F. Hornick, Erik Marcadi, Sunil Venkayala
- Data mining for intelligence, fraud, & criminal detection. Advanced Analytics & Information Sharing Technologies. Christopher Westphal
- Sequence Data Mining. Guozhu Dong, Jian Pei
- Введение в OLAP. Алексей Федоров, Наталия Елманова
- OLAP Solutions Building Multidimensional Information Systems. Erik Thomsen
- Data Warehouses and OLAP: Concepts, Architectures and Solutions. Robert Wrembel, Christian Koncilia
- The invisible Web : uncovering information sources search engines can’t see. Chris Sherman and Gary Price
- Web Analytics for dummies. Pedro Sostre, Jennifer LeClaire
- Kernel Methods for Pattern Analysis. John Shawe-Taylor, Nello Cristianini
- Rough – Granular Computing in Knowledge Discovery and Data Mining. Jaroslaw Stepaniuk
- Soft Computing in Web Information Retrieval. Models and Applications. eds. Enrique Herrera-Viedma, Gabriella Pasi, Fabio Crestani
- Supervised and Unsupervised Ensemble Methods and their Applications. eds. Oleg Okun, Giorgio Valentini
- Making sense of data II. A Practical Guide to Data Visualization, Advanced Data Mining Methods, and Applications. Glenn J. Myatt, Wayne P. Johnson
- Algorithms and Models for theWeb-Graph. International Workshop 2009. eds. Konstantin Avrachenkov. Debora Donato, Nelly Litvak
- Data Mining and Knowledge Discovery in Real Life Applications. eds. Julio Ponce, Adem Karahoca
- The top ten algorithms in data mining. ed. Xindong Wu, Vipin Kumar
- Transfer in Reinforcement Learning Domains. Matthew E. Taylor
- Data Science and Classification. eds. Vladimir Batagelj a.a.
- Foundations of Computational Intelligence. Volume 6. Data Mining. Ajith Abraham
- Toward Category-Level Object Recognition. eds. Jean Ponce, Martial Hebert, Cordelia Schmid, Andrew Zisserman
- Metalearning. Applications to Data Mining. Pavel Brazdil, Christophe Giraud-Carrier, Carlos Soares Ricardo Vilalta