CopyLeft (L) Юрий А. Денисов  
(yudenisov)  
Все права защищены  

 

Назад...   К содержанию выпуска   Далее...

 

Соотношение классического и креативного датамайнинга.

Содержание

C.1. Что такое классический, а что такое креативный датамайнинг?

Классический датамайнинг – это процесс сбора информации для принятия решения, в ходе которого подтверждается, оптимизируется целевая функция для выбранной модели ситуации, либо отвергается текущая модель процесса или ситуации. Результатом датамайнинга является документ, предлагающий принять одно из решений из нескольких возможных. Таким образом, в рамках классического датамайнинга:

  • не изменяется модель или целевая функция;
  • не происходит принятие решения исследователем после сбора информации (принятие решения делегируется другому лицу).

Из этого, однако, не следует, что заниматься классическим датамайнингом может любое лицо, даже не знакомое с сутью проблемы. Наоборот, человек, занимающийся классическим датамайнингом – это человек, являющийся, по крайней мере, специалистом в области исследований, превосходно владеющий компьютерной техникой и обладающий знаниями в области социальной инженерии. В разведке (в частности в разведывательных спецслужбах США: в ФБР, ЦРУ и АНБ) ценность специалиста по датамайнингу приравнивается к ценности резидента. В России уже осуждено несколько ученых за шпионаж в пользу иностранных государств, причем эти ученые не имели доступа и не передавали разведке засекреченные материалы. Вся их вина заключалась в том, что они передавали иностранным государствам свои исследования методами датамайнинга, материалы к которым они брали из открытых (!) источников [26]. После этого у Вас не должно быть никаких сомнений в важности и серьезности датамайнинга как дисциплины.

Креативный датамайнинг - это процесс сбора информации (data mining), при котором его участник не только копит информацию, но и принимает участие в ее промежуточном анализе и переработке, позволяющей более целенаправленно искать новую информацию. То есть участник сбора становится для аналитика не просто «неквалифицированным сборщиком» информации, но и создателем (“create”) новых идей и соавтором в работе. Креативный датамайнинг основан на построении иерархического дерева интеллект-карт, с помощью которого анализируется и фильтруется старая информация, и дается направление на поиск новых данных.

C.2. Чем креативный датамайнинг отличается от классического датамайнинга?

Креативный датамайнинг отличается от классического [13]:

  1. Активной позицией сборщика данных. Он перестает быть «тупым исполнителем» для аналитика, а в чем-то становится соавтором работы.
  2. Информация в креативном датамайнинге не просто собирается и подшивается в папки, но проходит стадию предварительного анализа и выделения опорных пунктов.
  3. В креативном датамайнинге, в отличие от классического датамайнинга, широко используются интеллект карты.
  4. Классический датамайнинг для представления своих данных использует понятия «конспект» и «логическая временная последовательность». Креативный же датамайнинг оперирует понятиями «ассоциация» и «гештальт».

C.3. Что можно, а чего нельзя создать с помощью креативного датамайнинга?

Креативный датамайнинг по своим созидательным функциям намного богаче классического датамайнинга. Он более «естественно» вписывается в структуру человеческого интеллекта, позволяя «из глубин разума» доставать данные для анализа и последующей обработки. С его помощью одна большая задача разбивается на множество «подзадач», из которых как «кирпичиков» строится новая работа.

Итак, креативный датамайнинг можно использовать:

  1. Для написания статей, очерков, обзоров, рефератов и т. п. - в качестве основного элемента планирования содержания.
  2. Для помощи в составлении аналитических записок, бизнес-планов, справок и т.п. - для обозначения структуры и организации дальнейшего поиска.
  3. В сочетании с классическим датамайнингом - как постановщик задачи при поиске.
  4. При написании сочинений, изложений, авторской переработке текста и прочих работ, связанных с изменением содержания и другой работы - для уяснения точки зрения автора исходной работы и составления плана «новой» работы с привнесением своего видения проблем.
  5. При «мозговом штурме», на совещаниях, лекциях, презентациях - в качестве основного средства записи и запоминания информации.
  6. При «развертке» интеллект-карты из конспекта или, наоборот, «свертке» интеллект-карты в конспект.

С помощью креативного датамайнинга нельзя:

  1. Создавать художественные произведения в классическом стиле (здесь требуется талант) [14].
  2. Вести протоколы собраний, конференций, делать другие строго фиксирующую временную и логическую последовательность работы. Здесь место только классическому датамайнингу.
  3. Построение чертежей, создание программ и других готовых продуктов творчества. Однако здесь креативный датамайнинг можно использовать на начальных и промежуточных этапах.

C.4. Использование классического и креативного датамайнинга на примере «Выбор профессии молодым человеком».

Рассмотрим весьма жизненный пример – выбор молодым человеком профессии после окончания средней школы. В школе у молодого человека были различные увлечения, но как проверить, насколько они смогут пройти испытание временем? Выбор профессии осложняется, как это ни странно, если у человека одни отличные отметки по всем предметам. Если у ученика нет устойчивой, всепоглощающей страсти к какой-либо одной области деятельности, то в какой из областей он может преуспеть? Как правило, такие бывшие школьники идут в престижные вузы получать «модную» специальность. Но модная специальность – отнюдь не залог карьерного роста. Здесь нужны личные качества, и не в последнюю роль играет любовь к профессии. Вдумайтесь, что большая часть людей с отвращением ходят на работу, жалуясь на свою зарплату и условия работы, но ничего не желая менять вокруг себя. И это печально.

В принципе, все виды работы можно разделить на три большие группы, не зависящие от выбранной в государстве классификации профессий и специальностей [27]:

  1. Прогнозирование. Люди этих профессий занимаются сбором информации (датамайнинг, статистика, мониторинг, маркетинг) для принятия решения по управлению отраслью вообще и предприятия в частности. В настоящее время эта группа профессий является наиболее востребованной в обществе.
  2. Творчество. Люди этих профессий «создают» новые идеи, методы, алгоритмы, проектируют новое оборудование и транспортные средства, пишут музыку, рисуют картины, снимают кинофильмы и т.д. По мнению автора, это – наиболее интересная, но и наименее оплачиваемая область деятельности. Здесь действует следующее правило: «доллар тому, кто придумал, десять долларов тому, кто сделал, сто долларов тому, кто продал и тысяча долларов тому, кто это все организовал». Как видим, большая часть денег оседает у представителей первой группы профессий.
  3. Преобразование. Люди этой группы профессий как раз занимаются внедрением в жизнь чужих мыслей. Именно они строят города, прокладывают дороги, выпускают транспортные средства, перевозят сырье и товары, «доводят до ума» творческие идеи (например, в проектировании), «кодируют» алгоритмы и т.д. Практически все, что создано вокруг Вас, создано либо людьми этих профессий, либо при непосредственном их использовании. В «нормальной» ситуации в экономике и стране эти люди куют богатства страны и народа, приносят наибольшую пользу для государства, и им за это хорошо платят. Но во времена кризисов именно эту категорию людей ждут сокращения, понижение зарплаты, бедность и нищета. К этой категории профессий относятся все рабочие профессии, большинство инженерных, педагогических, медицинских профессий и часть профессий работников культуры. В настоящее время такие специальности считаются не престижными, но это является следствием ненормальной ситуации в стране.

В принципе любой выпускник должен знать – его карьерный рост, а, следовательно, заработанная плата и социальное положение, напрямую зависит от его личных качеств, а не престижности и рейтинга его профессии. Необходимо лишь получить необходимые знания, а как Вы ими распоряжаетесь – все зависит только от Вас. Поэтому к выбору профессии необходимо подходить со стороны: «А не будет ли мне противно заниматься моими служебными обязанностями?» Подумайте, а стоит ли Вам оканчивать Плехановский институт, чтобы все время проработать в должности младшего экономиста в филиале какой-нибудь мелкой конторы? Не лучше ли пойти учиться в технический ВУЗ и после занять должность главного инженера Норильского Никеля?

Примечание: пример взят из жизни автора.

Второй классификацией профессий и специальностей является их условное разделение на точные и гуманитарные профессии. Однако эта общепринятая классификация, которая хорошо работает для разделения дисциплин, плохо подходит для разделения профессий. Очень часто инженеры пишут техническое задание и руководство пользователя. Также социологам требуется обработать статистические данные с помощью одной или нескольких математических моделей. В любом случае школа и институт предлагают только «направление следования», а не обучают человека «от и до» нужной специальности.

Итак, Вы приблизительно осознали свои склонности (по этим двум классификациям), но еще сомневаетесь в выборе профессии? тогда изучайте интеллект-карту (см. рисунок C.001.).

Интеллект-карта "Классификация профессий"

Рис. C.001. Интеллект карта классификация профессий.

Эта интеллект карта поможет Вам приблизительно определиться с выбором Вами профессии «разумом».

Далее, исходя из своих склонностей, выберите профессию исходя из Вашего склада ума, физических способностей, эмоциональной устойчивости. Для этого спросите своих старших друзей, которые уже работают по интересующей Вас специальности, родителей, педагогов. Весьма полезным будет работа на предприятии в школьной или институтской практике. При этом не «зацикливайтесь» на какой-либо одной профессии – чем больше профессий Вы перепробовали, тем выше Ваш опыт и кругозор и тем проще Вам будет получить нужный диплом (хотя бы об окончании краткосрочных курсов).

Необходимо заметить, что многие профессии, науки и специальности появились и продолжают появляться «на стыке» классических дисциплин. Примером таких наук являются науки: «Физическая химия» и «Химическая физика». Не вдаваясь в предметы и методы данных наук, автор отмети одно различие, важное для абитуриентов: первую специальность Вы будете получать на химическом, а вторую – на физическом факультете университета (или института). Поэтому при выборе специальности попытайтесь узнать учебный план и учебный стандарт для выбираемой Вами специальности.

Следовательно, выбирая свою профессию, желательно найти в Интернете следующие документы:

  1. Список рабочих специальностей (профессий) по общероссийскому классификатору.
  2. Образовательный стандарт (требования к подготовке) по этим специальностям.
  3. Список ВУЗов (техникумов, ПТУ, мастерских), предлагающее обучение по выбранным в пунктах №№ 1 и 2 специальностям.
  4. Лишь после этого необходимо ознакомиться с требованиями, условиями обучения и стоимостью обучения в выбранном Вами учебном заведении.
  5. При поиске информации по выбранной профессии широко используйте форумы, чаты, на которых общаются «мастера» и студенты, обучающиеся данной профессии. Конечно, информация, собранная там, будет весьма одностороняя. Однако Вы «окунётесь» в среду, в которой живут представители данной профессии, научитесь профессиональному сленгу, узнаете о всемирных «светилах» и местных «авторитетах» в данной области. Все это окажет неоценимую помощь при подготовке к поступлению в ВУЗ.

Весьма полезным для поступления в ВУЗ, в техникумы и т.п. будет Ваше участие в различных конкурсах, школьных олимпиадах, академических боях и т.п. На них Вы, возможно, познакомитесь не только со своими будущими однокурсниками, но и с Вашими будущими преподавателями основных дисциплин. А главное, Вы дыхнете воздух академической свободы, познаете радость общения со своими будущими коллегами, «в честном бою» отстоите свое право быть лучшим по профессии.

На рисунке C002 приведен примерный алгоритм поиска профессиимолодым человеком с использованием методов датамайнинга.

Схема поиска профессии молодым человеком

Рис. C002. Блок-схема № 1 поиска профессии молодым человеком (девушкой).

Кроме участия в конкурсах, молодому человеку также необходимо определиться в следующих вопросах:

  • Найду ли я работу по специальности в своем городе (области, стране)?
  • Не потребуется ли для получения профессии уезжать в другой город, регион и т.п.?
  • А стоит ли вообще «овчинка выделки»? Соответствует ценность профессии (в денежном выражении) затратам на ее получение и последующее трудоустройство?

Эти вопросы отображаются на блок-схеме на рисунке C.003.

Схема поиска профессии молодым человеком

Рис. C003. Блок-схема № 2 поиска профессии молодым человеком (девушкой).

В отдельном приложении (ссылка здесь) будут представлены алгоритмы поиска пофессии в Интернете и ссылки на специализированные сайты.

C.5. Резюме.

В этом разделе Вы наконец-то получили определение понятий «классический датамайнинг» и «креативный датамайнинг». Вы выяснили, насколько эти понятия разделены «в пространстве и времени», а также коснулись ограничений, накладываемых на креативный датамайнинг. В качестве примера использования креативного датамайнинга приведен пример: «Выбор профессии молодым человеком».

На этом описание теоретических основ датамайнинга заканчивается, равно как заканчивается первый выпуск первого тома. В остальных выпусках будет рассказано о практических аспектах исследования методом датамайнинга, а также приведены описания программ, используемых в датамайнинге.

Вопросы и упражнения.

  1. Объясните разницу в подходе к целевой функции в классическом и креативном датамайнинге.
  2. Приведите примеры ситуаций, где необходимо, а где не нужно использовать креативный датамайнинг.
  3. Используйте приведенный в разделе C.4. пример для анализа своей мотивации к выбору профессии.

 

Назад...   К содержанию выпуска   Далее...

 

Версия сайта 1.1.1 beta
от 20 июня 2011 г.

Гостевая книга Обсуждение датамайнинга в блоге. Отправить E-mail Автору проекта.

Hosted by uCoz