Книга: Технологии анализа данных

Представлен всесторонний анализ вопросов, связанных с современными технологиями анализа данных. Рассматриваются наиболее востребованные методы. Даются основные понятия языка статистического анализа R, разбираются примеры его использования для решения практических задач. Предназначено для студентов факультета электроники и вычислительной техники очной и заочной форм обучения.

Информация о документе

Формат документа
PDF
Кол-во страниц
65 страниц
Загрузил(а)
Лицензия
Доступ
Всем
Просмотров
4

Информация о книге

ISBN
9785994818978
Издательство
ВолгГТУ
Год публикации
2015
Автор(ы)
Н. П. Садовникова, М. В. Щербаков
Библиографическая запись
  1. Найдич, А. Большие данные: насколько они большие? [Электронный ресурс] / А. Найдич. - М.: Компьютер Пресс, 2012. - Режим доступа: http://compress.ru/article.aspx?id=23469.
  2. Тиндал, Сьюзен. Большие данные: все, что вам необходимо знать [Электронный ресурс] / Сьюзен Тиндал: PC Week/RE. - М., 2012. - Режим доступа: http://www.pcweek.ru/idea/article/detail.php?ID=141962.
  3. Майер-Шенбергер, Виктор. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим / Виктор Майер-Шенбергер, Кеннет Кукьер; пер. с англ. Инны Гайдюк. - М.: Манн, Иванов и Фербер, 2014. - 240 с.
  4. Паклин, Н. Б. Бизнес-аналитика от данных к знаниям / Н. Б. Паклин, В. И. Орешков. - 2-изд., испр. - СПб.: Питер, 2013. - 706 с.
  5. Ralph Kimball, Margy Ross. The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, John Wiley and Sons, Ltd, 2013. - 421 p.
  6. Yahoo! Apache Hadoop [Электронный ресурс]. - Режим доступа: https://developer.yahoo.com/hadoop/tutorial/module1.html.
  7. Ханк,
Список литературы
  1. Найдич, А. Большие данные: насколько они большие? [Электронный ресурс] / А. Найдич. - М.: Компьютер Пресс, 2012. - Режим доступа: http://compress.ru/article.aspx?id=23469.

  2. Тиндал, Сьюзен. Большие данные: все, что вам необходимо знать [Электронный ресурс] / Сьюзен Тиндал: PC Week/RE. - М., 2012. - Режим доступа: http://www.pcweek.ru/idea/article/detail.php?ID=141962.

  3. Майер-Шенбергер, Виктор. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим / Виктор Майер-Шенбергер, Кеннет Кукьер; пер. с англ. Инны Гайдюк. - М.: Манн, Иванов и Фербер, 2014. - 240 с.

  4. Паклин, Н. Б. Бизнес-аналитика от данных к знаниям / Н. Б. Паклин, В. И. Орешков. - 2-изд., испр. - СПб.: Питер, 2013. - 706 с.

  5. Ralph Kimball, Margy Ross. The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, John Wiley and Sons, Ltd, 2013. - 421 p.

  6. Yahoo! Apache Hadoop [Электронный ресурс]. - Режим доступа: https://developer.yahoo.com/hadoop/tutorial/module1.html.

  7. Ханк, Д. Э. Бизнес-прогнозирование: пер. с англ. / Д. Э. Ханк, Д. У. Уичерн, А. Д. Райтс. - 7-е изд. - М.: Вильямс, 2003. - 651 с.

  8. Анализ данных и процессов: учеб. пособие / А. А. Барсегян [и др.]. - 3-е изд., перераб. и доп. - СПб.: БХВ-Петербург, 2009. - 512 с.

  9. Любицын, В. Н. Повышение качества данных в контексте современных аналитических технологий / В. Н. Любицын // Вестник ЮУрГУ. - 2012. - № 23. - C. 83-86.

  10. Большие данные [Электронный ресурс] / TADVISER. - Режим доступа: http://www.tadviser.ru/index.php.  
    
  11. Воронцов, К. В. Курс лекций [Электронный ресурс] / К. В. Воронцов. - Режим доступа: http://www.machinelearning.ru.  
    
  12. Боровиков, В. П. Популярное введение в современный анализ данных в системе STATISTICA / В. П. Боровиков. - М.: Горячая линия - Телеком, 2013. - 288 с.  EDN: SDSJFB  
    
  13. Халафян, А. А. STATISTICA 6. Статистический анализ данных / А. А. Халафян. - М.: Бином-Пресс, 2010. - 528 с.  EDN: QTNDAX  
    
  14. Наследов, А. IBM SPSS Statistics 20 и Amos: Профессиональный статистический анализ данных: Практическое руководство / А. Наследов. - СПб.: Питер, 2013. - 416 c.  EDN: TBMLGF  
    
  15. Data Mining (Megaputer Intelligence, PolyAnalyst) [Электронный ресурс]: Режим доступа: http://www.exponenta.ru/soft/Others/polyanalyst/ polyanalyst.asp.  
    
  16. Кулаичев, А. П. Методы и средства комплексного анализа данных: учеб. пособие для вузов по дисциплинам «Прикладная статистика», «Информатика» / А. П. Кулаичев. - 4-е изд., перераб. и доп. - М.: ФОРУМ: ИНФРА-М, 2006. - 512 с.  EDN: QMPIQR  
    
  17. Мастицкий, С. Э. Статистический анализ и визуализация данных с помощью R [Электронный ресурс] / С. Э. Мастицкий, В. К. Шитиков // R: Анализ и визуализация данных. - 2014. - Режим доступа: http://r-analytics. blogspot.com.  EDN: ZVYKKT  
    
  18. Бесплатные online курсы на CodeSchool по R [Электронный ресурс]. - Режим доступа: https://www.codeschool.com/courses/try-r.  
    
  19. Курсы на Coursera по анализу данных [Электронный ресурс]. - Режим доступа: https://www.coursera.org/specializations/jhudatascience.  
    
  20. Венэбльз, У. Н. Введение в R. Версия 3.1.0 / У. Н. Венэбльз, Д. М. Смит; пер. и ред. А. А. Фоменко. - М., 2014. - 109 с.  
    
  21. Chang, W. R. Graphics Cookbook / W.Chang. - O'Reilly Media, 2013. - 416 p.  
    
  22. Воронцов, К. В. Алгоритмы кластеризации и многомерного шкалирования: Курс лекций. МГУ / К. В. Воронцов. - М., 2007. - 18 с.  
    
  23. Миркин, Б. Г. Методы кластер-анализа для поддержки принятия решений: обзор / Б. Г. Миркин; Национальный исследовательский университет «Высшая школа экономики». - М.: Изд. дом Национального исследовательского университета «Высшая школа экономики», 2011. - 88 с.  EDN: QUSUXH  
    
  24. MacQueen J. B. Some methods for classification and analysis of multivariate observations // Proc. of the 5th Berkeley Symposium on Mathematical Statistics and Probability. Vol. 1. Berkeley: Univ. of Calif. Press, pp. 281-297, 1967.  
    
  25. Bezdek J., Hathaway R., Sobin M., Tucker W.Convergence theory for fuzzy c-means: counterexamples and repairs // IEEE Trans. on Systems, Man, and Cybernetics. 1987. N 17. - Рр. 873-877.  
    
  26. Huang, Z. Clustering large data sets with mixed numeric and cate-gorical values, Proceedings of the First Pacific Asia Knowledge Discovery and Data Mining Conference, Singapore, pp. 21-34, 1997.  
    
  27. Huang, Z. Extensions to the k-modes algorithm for clustering large data sets with categorical values, Data Mining and Knowledge Discovery 2(3), pp. 283-304, 1998.  
    
  28. Cao, F., Liang, J, Bai, L.: A new initialization method for categorical data clustering, Expert Systems with Applications 36(7), pp. 10223-10228, 2009.  
    
  29. Sharmila, Kumar, M. An optimized farthest first clustering algorithm, Engineering (NUiCONE), Nirma University International Conference, India, pp. 1-5, 2013.  
    
  30. Bahmani, B., Moseley, B., Vattani, A., Kumar, R., Vassilvitskii, S.: Scalable k-means++, Journal Proceedings of the VLDB Endowment, Vol. 5 issue 7, pp. 622-633, 2012.  
    
  31. Zhang, T.; Ramakrishnan, R.; Livny, M.: BIRCH: an efficient data clustering method for very large databases, Proceedings of the 1996 ACM SIGMOD international conference on Management of data. - SIGMOD '96, New York, USA, pp. 103-114, 1996.  
    
  32. Ke Wang, Chu Xu, Bing Liu. Clustering Transactions Using Large Items, In Proc. CIKM'99, Kansas, Missouri, 1999.  
    
  33. Yang, Y., Guan, X., You, J.: CLOPE: a fast and effective clustering algorithm for transactional data, Proceeding KDD '02 Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining, New York, USA, pp. 682-687, 2002.  
    
  34. Guojun Gan, Chaoqun Ma, Jianhong Wu. Data Clustering: Theory, Algorithms, and Applications, ASA-SIAM Series on Statistics and Applied Probability, SIAM, p. 466, 2007.  
    
  35. Дрейпер, Н. Прикладной регрессионный анализ: в 2 т. / Н. Дрейпер, Г. Смит. - М.: Финансы и статистика, т. 1 - 1986, т. 2 - 1987.  
    
  36. Петрович, М. Л. Регрессионный анализ и его математическое обеспечение на ЕС ЭВМ: Практическое руководство / М. Л. Петрович. - М.: Финансы и статистика, 1982. - 199 с.  
    
  37. Ивахненко, А. Г. Индуктивный метод самоорганизации моделей сложных систем / А. Г. Ивахненко. - К.: Наук. думка, 1982. - 360 с.  
    
Каталог SCI
Нанотехнология