Category: it

Category was added automatically. Read all entries about "it".

Wayne_George_turtle_t

Про профессию data analyst

Меня недавно попросили рассказать про профессию data analyst. Обычно когда я отвечаю на такого рода вопросы, сначала изучаю предмет всесторонне и стараюсь ответить как можно более точно и универсально. А тут вот делаю исключение и расскажу главным образом про свой личный опыт, который, ясное дело, и специфический, и ограниченный. Collapse )

Теперь, после этого "развёрнутого вступления", отвечу на конкретные вопросы.

Как приобретают такую специальность? Вот, romanet говорит, что надо выучить курс статистики, и это наверное так и есть. Кроме этого желательно ознакомиться с базами данных и языком запросов (SQL). А ещё не повредит умение манипулировать текстовыми файлами.

Какие качества, навыки, знания (кроме SAS, Access, Excel) ценятся больше всего? На самом деле даже эти три необязательны. Вместо SAS'а может быть, к примеру, SPSS, Matlab или другой специализированный софт, а вместо Acess’а скажем, SQL Server или Oracle. Наверное не обойдёшься без Excel'а , потому что именно в нём зачастую надо делать отчёты: таблички и картинки-графики. А потом и в каком-нибудь PowerPoint’е. Но и тут могут быть варианты, потому что софта для отчётов тоже хватает. Короче говоря, слишком привязываться к какому-то конкретному инструменту не надо, а вот быть готовым к работе по нескольким направлениями надо. Что это за направления? Обязательная часть: запросы к базам данных и изготовление отчётов в виде таблиц и графиков. Опциональная, но тоже важная часть: работа с каким-нибудь специализированным софтом для data analysis и data mining. Ещё более опциональная часть: обработка текстовых файлов. Общий принцип такой: чем больше знаешь и умеешь, тем лучше – всё может пригодиться. А ценится больше всего ум и сообразительность плюс умение применить их к решению конкретных задач.

Насколько интересна или занудна эта работа? Дежурный ответ -- смотря кому. Мне вот очень даже интересна, потому как я люблю решать задачки и узнавать новое про людей. Профессия data analyst комбинирует в себе оба этих занятия.

Уровень стресса, востребованность рынком. Опыт показывает, что уровень стресса связан, скорее, не со специальностью, как таковой, а с тем, как налажена и организована работа, подходит ли она работнику, и кто работает рядом с ним или с ней. Стресса в нашем отделе хватало, но меня он чаще не утомлял, а развлекал -- пока наши дела не стали плохи, тогда, конечно, не до развлечений становится.

Про востребованность рынком -- она вполне заметна, Спецы по анализу данных нужны практически везде: и в бизнесе, и в социальных науках, и в здравоохранении, и в безопасности. Это как бы вообще, а конкретно, пока наш отдел фурычил, нам постоянно были нужны люди. Они приходили и уходили, кто сам, а кто не сам. И надо сказать, что найти по-настоящему хорошего специалиста было нелегко.

И в заключении картинка на тему:

Текст тут такой. На первой картинке data analyst (знаменитый персонаж комиксов Dilbert) говорит: "У меня нет точных цифр, поэтому я взял их с потолка". На второй картинке он же продолжает: "Исследования показывают, что от точных цифр пользы не больше, чем от цифр, взятых с потолка." На третьей его спрашивают: "Сколько исследований показали это?", -- на что он отвечает: "87".
Wayne_George_turtle_t

Про obfuscation

На прошлой неделе случайно узнала новое английское слово: obfuscation. Мультиран даёт такие русскоязычные аналоги:

- затемнение; помутнение
- умышленное запутывание вопроса
- спутанность сознания; затемнение сознания; помутнение рассудка; спутанность сознания (помрачение сознания)
- умышленная непонятность

А вообще это термин, обозначающий приём, который, оказывается, бывает нужен при работе в IT, например, с базами данных. Реальный пример: нужно дать кому-то на сторону пробный кусок данных из собственных таблиц, который был бы, одновременно, правдоподобный и неверный. Не для того, чтобы специально запутать врага, а чтобы не разгласить лишнего нейтральному помощнику, главная цель которого -- сделать что-то полезное для нас же, используя эти данные.

Мерриам-вебстер говорит, что это слово произошло от латинского obfuscatus, и замечено в английском языке впервые в 1577 году. Вот ведь...
Wayne_George_turtle_t

Про Анжелу Байрон

Пришёл нам свежий (апрельский) номер Linux Journal с необычной для себя обложкой -- фотографией симпатичной девушки (говорят, первая женщина на обложке за все 204 выпуска):


Девушка заинтересовала, и я её погуглила. Ну, и интервью с ней прочитала. Зовут её Анжела (Энжи) Байрон. Получается, что однофамилица лорда Байрона, поэта; насчёт родственница ли, не знаю, но очевидно, что она достойная продолжательница дела его дочки, Ады Лавлейс, первой в мире программистки. Энжи живёт в Канаде (Ванкувере) и активно разрабатывает Drupal, начиная с 2005 года. У неё и ник занятный: webchick (вебчик). Вот её более крупный потрет:


Пару интересных и полезных фактов про неё.

Впервые она узнала про идею open source (свободное программное обеспечение, которое могут разрабатывать все, кому не лень) ещё будучи школьницей, но сама в это дело лезть не посмела -- у неё были представления, что в этой секте одни гении, а себя она к ним не причисляла. Через десять лет, когда она была уже студенткой, её пригласили в гугловский летний лагерь. Там она решила заняться друпалом -- потому что на нём был сделан сайт, продвигавший Firefox (а узнала она об этом, потому что имела привычку смотреть код интересных сайтов).

Она придумала, что будет делать, но не знала даже, с чего начать, тем более, что ни документации, ни книжек тогда особенно не было. Тогда она сделала очень интересный ход: пошла в группу поддержки, чтобы выяснить, что люди спрашивают, и что и как им отвечают те, кто знают. Через несколько недель она уже и сама получила репутацию эксперта. Одновременно стала писать документацию -- такую, которая была бы полезна ей самой. Ну, а в процессе избавилась от мифа, что только боги горшки обжигают пишут программы. Конечно, гении среди опенсорсников тоже попадаются, но большинство там вполне нормальные -- просто сильно увлечённые.

В результате, кроме всего прочего, она и книжку выпустила в команде, вот эту: Collapse )

PS В виде дополнения сделала пост в ru_herself: Программистки, там можно и на других коллег Энжи посмотреть (источник тот же).
Wayne_George_turtle_t

Про Sybase

Пропал оказывается Sybase, съели его немцы из SAP AG: Software maker SAP completes Sybase acquisition. Н-да, sic transit gloria mundi...

Нет, конечно, физически он никуда не делся -- здание стоит, люди работают, продукты выпускают, начальство хорохорится и даже обещает пощипать Oracle (At TechWave, Sybase's Chen Promises No Products Left Behind), но, во-первых, это уже никакой не Sybase, а американское отделение европейского международного концерна, а во-вторых, кто им раньше мешал победить всех конкурентов?...

А как хорошо начинали! В далёком 1984 году собрались четыре чувака, точнее, три чувака и одна чувиха в доме у одного из них и сделали первую систему, в которой реляционная база данных (сама по себе большая и важная новинка на то время) обслуживала несколько компьютеров сразу. По сути, это "базоданновый сервер" (database server) с сетью компьютеров-клиентов. Полное название: Relational database management system (RDBMS). Из этой системы потом (после сделки с Майкрософтом) получилось то, что сейчас называется Microsoft SQL Server (дебильная, зато популярная база данных, по крайней мере, в Штатах, постоянно приходится с ней дело иметь).

Ну, а главное, наверное их достижение, по поводу которого как раз и уместо вспомнить латинскую поговорку о проходящей земной славе -- это незабвенный Power Builder. Ещё в 90-х в Штатах он был супер-горячим продуктом, и многие новоприбывшие из экс-Союза музыканты, футболисты и парикмахерши учили его на скоростных курсах и у продвинутых частников -- дабы переквалицироваться в программисты (даже я прочитала книжку PowerBuilder in 24 hours :)). И многие таки переквалифицировались, но большинству из них потом пришлось переучиваться на что-нибудь другое. Он ещё не совсем умер, конечно, но вряд ли его употребление будет расширяться, а вот процесс сужения рынка скорей всего продолжится...

И что интересно? Точнее, совсем не интересно, а просто противно. В англоязычном оригинале статьи в википедии названы все четыре основоположника компании и продукта, а в русской версии -- только два, Роберт Эпштейн (Robert Epstein) и Том Хаггин (Tom Haggin), причём, "выпали", кроме Марк Хоффмана (Mark Hoffman), ещё и Джейн Доти (Jane Doughty). Интересно, почему это к ним такая немилость? Подозреваю, это потому что "женщины -- не программисты" (реальная фраза, услышанная мой дочерью на интервью в Москве). Правда, Марк-то тут причём?...

Вот они, пионеры Sybase в свои лучшие времена: Collapse )
Wayne_George_turtle_t

Про северных оленей (и программистов)

Wayne_George_turtle_t

Про Сару Шарп

Есть такая американская программистка Сара Шарп (Sarah Sharp) по прозвищу Geekess. Она работает в Интеле (Intel). А сегодня прошла новость, что для Линуха разработан первый драйвер под USB 3.0: Linux first to offer USB 3.0 driver, и что его сделала Сара Шарп. Драйвер готов уже сейчас, формальная поддержка начнётся в сентябре.

Вот такая она "гикесса" Сара по фамилим "Острая" :)



PS По первой ссылке можно попасть на персональный сайт Сары и взять там этот драйвер -- ну, если у кого уже есть третий USB и линукс впридачу.
Wayne_George_turtle_t

Про нового лауреата "нобелевской" премии по программированию

В информатике есть такая премия Тьюринга (Turing Award. Как пишет википедия, это "самая престижная премия в информатике, вручаемая Ассоциацией вычислительной техники за выдающийся научно-технический вклад в этой области". В этом году эту премию получила женщина, американка Барбара Лисков: Collapse )
Wayne_George_turtle_t

Рабочее (кое-какие странности SQL Server'а)

В общем, это может быть интересно разве что коллегам по специальности data analyst, да и то, только тем, кто работает вплотную с SQL Server-ом. Особенная надежда у меня в этом смысле на новую френдессу uro_da :) и на "старую" френдессу gem_in_i. Может, есть и другие спецы по этому делу у меня во френд-ленте, а я просто не знаю, так что колитесь :). Короче, нашла я что-то типа "бага", точнее, "неприятной особенности" SQL Server'а, которую пока что просто обошла :) Collapse )