Category: it

Wayne_George_turtle_t

Про профессию data analyst

Меня недавно попросили рассказать про профессию data analyst. Обычно когда я отвечаю на такого рода вопросы, сначала изучаю предмет всесторонне и стараюсь ответить как можно более точно и универсально. А тут вот делаю исключение и расскажу главным образом про свой личный опыт, который, ясное дело, и специфический, и ограниченный. Collapse )

Теперь, после этого "развёрнутого вступления", отвечу на конкретные вопросы.

Как приобретают такую специальность? Вот, romanet говорит, что надо выучить курс статистики, и это наверное так и есть. Кроме этого желательно ознакомиться с базами данных и языком запросов (SQL). А ещё не повредит умение манипулировать текстовыми файлами.

Какие качества, навыки, знания (кроме SAS, Access, Excel) ценятся больше всего? На самом деле даже эти три необязательны. Вместо SAS'а может быть, к примеру, SPSS, Matlab или другой специализированный софт, а вместо Acess’а скажем, SQL Server или Oracle. Наверное не обойдёшься без Excel'а , потому что именно в нём зачастую надо делать отчёты: таблички и картинки-графики. А потом и в каком-нибудь PowerPoint’е. Но и тут могут быть варианты, потому что софта для отчётов тоже хватает. Короче говоря, слишком привязываться к какому-то конкретному инструменту не надо, а вот быть готовым к работе по нескольким направлениями надо. Что это за направления? Обязательная часть: запросы к базам данных и изготовление отчётов в виде таблиц и графиков. Опциональная, но тоже важная часть: работа с каким-нибудь специализированным софтом для data analysis и data mining. Ещё более опциональная часть: обработка текстовых файлов. Общий принцип такой: чем больше знаешь и умеешь, тем лучше – всё может пригодиться. А ценится больше всего ум и сообразительность плюс умение применить их к решению конкретных задач.

Насколько интересна или занудна эта работа? Дежурный ответ -- смотря кому. Мне вот очень даже интересна, потому как я люблю решать задачки и узнавать новое про людей. Профессия data analyst комбинирует в себе оба этих занятия.

Уровень стресса, востребованность рынком. Опыт показывает, что уровень стресса связан, скорее, не со специальностью, как таковой, а с тем, как налажена и организована работа, подходит ли она работнику, и кто работает рядом с ним или с ней. Стресса в нашем отделе хватало, но меня он чаще не утомлял, а развлекал -- пока наши дела не стали плохи, тогда, конечно, не до развлечений становится.

Про востребованность рынком -- она вполне заметна, Спецы по анализу данных нужны практически везде: и в бизнесе, и в социальных науках, и в здравоохранении, и в безопасности. Это как бы вообще, а конкретно, пока наш отдел фурычил, нам постоянно были нужны люди. Они приходили и уходили, кто сам, а кто не сам. И надо сказать, что найти по-настоящему хорошего специалиста было нелегко.

И в заключении картинка на тему:

Текст тут такой. На первой картинке data analyst (знаменитый персонаж комиксов Dilbert) говорит: "У меня нет точных цифр, поэтому я взял их с потолка". На второй картинке он же продолжает: "Исследования показывают, что от точных цифр пользы не больше, чем от цифр, взятых с потолка." На третьей его спрашивают: "Сколько исследований показали это?", -- на что он отвечает: "87".
Wayne_George_turtle_t

Про Sybase

Пропал оказывается Sybase, съели его немцы из SAP AG: Software maker SAP completes Sybase acquisition. Н-да, sic transit gloria mundi...

Нет, конечно, физически он никуда не делся -- здание стоит, люди работают, продукты выпускают, начальство хорохорится и даже обещает пощипать Oracle (At TechWave, Sybase's Chen Promises No Products Left Behind), но, во-первых, это уже никакой не Sybase, а американское отделение европейского международного концерна, а во-вторых, кто им раньше мешал победить всех конкурентов?...

А как хорошо начинали! В далёком 1984 году собрались четыре чувака, точнее, три чувака и одна чувиха в доме у одного из них и сделали первую систему, в которой реляционная база данных (сама по себе большая и важная новинка на то время) обслуживала несколько компьютеров сразу. По сути, это "базоданновый сервер" (database server) с сетью компьютеров-клиентов. Полное название: Relational database management system (RDBMS). Из этой системы потом (после сделки с Майкрософтом) получилось то, что сейчас называется Microsoft SQL Server (дебильная, зато популярная база данных, по крайней мере, в Штатах, постоянно приходится с ней дело иметь).

Ну, а главное, наверное их достижение, по поводу которого как раз и уместо вспомнить латинскую поговорку о проходящей земной славе -- это незабвенный Power Builder. Ещё в 90-х в Штатах он был супер-горячим продуктом, и многие новоприбывшие из экс-Союза музыканты, футболисты и парикмахерши учили его на скоростных курсах и у продвинутых частников -- дабы переквалицироваться в программисты (даже я прочитала книжку PowerBuilder in 24 hours :)). И многие таки переквалифицировались, но большинству из них потом пришлось переучиваться на что-нибудь другое. Он ещё не совсем умер, конечно, но вряд ли его употребление будет расширяться, а вот процесс сужения рынка скорей всего продолжится...

И что интересно? Точнее, совсем не интересно, а просто противно. В англоязычном оригинале статьи в википедии названы все четыре основоположника компании и продукта, а в русской версии -- только два, Роберт Эпштейн (Robert Epstein) и Том Хаггин (Tom Haggin), причём, "выпали", кроме Марк Хоффмана (Mark Hoffman), ещё и Джейн Доти (Jane Doughty). Интересно, почему это к ним такая немилость? Подозреваю, это потому что "женщины -- не программисты" (реальная фраза, услышанная мой дочерью на интервью в Москве). Правда, Марк-то тут причём?...

Вот они, пионеры Sybase в свои лучшие времена: Collapse )
Wayne_George_turtle_t

Про северных оленей (и программистов)

Wayne_George_turtle_t

Про Сару Шарп

Есть такая американская программистка Сара Шарп (Sarah Sharp) по прозвищу Geekess. Она работает в Интеле (Intel). А сегодня прошла новость, что для Линуха разработан первый драйвер под USB 3.0: Linux first to offer USB 3.0 driver, и что его сделала Сара Шарп. Драйвер готов уже сейчас, формальная поддержка начнётся в сентябре.

Вот такая она "гикесса" Сара по фамилим "Острая" :)



PS По первой ссылке можно попасть на персональный сайт Сары и взять там этот драйвер -- ну, если у кого уже есть третий USB и линукс впридачу.
Wayne_George_turtle_t

Про нового лауреата "нобелевской" премии по программированию

В информатике есть такая премия Тьюринга (Turing Award. Как пишет википедия, это "самая престижная премия в информатике, вручаемая Ассоциацией вычислительной техники за выдающийся научно-технический вклад в этой области". В этом году эту премию получила женщина, американка Барбара Лисков: Collapse )
Wayne_George_turtle_t

Рабочее (кое-какие странности SQL Server'а)

В общем, это может быть интересно разве что коллегам по специальности data analyst, да и то, только тем, кто работает вплотную с SQL Server-ом. Особенная надежда у меня в этом смысле на новую френдессу uro_da :) и на "старую" френдессу gem_in_i. Может, есть и другие спецы по этому делу у меня во френд-ленте, а я просто не знаю, так что колитесь :). Короче, нашла я что-то типа "бага", точнее, "неприятной особенности" SQL Server'а, которую пока что просто обошла :) Collapse )