Category: it

Category was added automatically. Read all entries about "it".

Wayne_George_turtle_t

Про профессию data analyst

Меня недавно попросили рассказать про профессию data analyst. Обычно когда я отвечаю на такого рода вопросы, сначала изучаю предмет всесторонне и стараюсь ответить как можно более точно и универсально. А тут вот делаю исключение и расскажу главным образом про свой личный опыт, который, ясное дело, и специфический, и ограниченный. Collapse )

Теперь, после этого "развёрнутого вступления", отвечу на конкретные вопросы.

Как приобретают такую специальность? Вот, romanet говорит, что надо выучить курс статистики, и это наверное так и есть. Кроме этого желательно ознакомиться с базами данных и языком запросов (SQL). А ещё не повредит умение манипулировать текстовыми файлами.

Какие качества, навыки, знания (кроме SAS, Access, Excel) ценятся больше всего? На самом деле даже эти три необязательны. Вместо SAS'а может быть, к примеру, SPSS, Matlab или другой специализированный софт, а вместо Acess’а скажем, SQL Server или Oracle. Наверное не обойдёшься без Excel'а , потому что именно в нём зачастую надо делать отчёты: таблички и картинки-графики. А потом и в каком-нибудь PowerPoint’е. Но и тут могут быть варианты, потому что софта для отчётов тоже хватает. Короче говоря, слишком привязываться к какому-то конкретному инструменту не надо, а вот быть готовым к работе по нескольким направлениями надо. Что это за направления? Обязательная часть: запросы к базам данных и изготовление отчётов в виде таблиц и графиков. Опциональная, но тоже важная часть: работа с каким-нибудь специализированным софтом для data analysis и data mining. Ещё более опциональная часть: обработка текстовых файлов. Общий принцип такой: чем больше знаешь и умеешь, тем лучше – всё может пригодиться. А ценится больше всего ум и сообразительность плюс умение применить их к решению конкретных задач.

Насколько интересна или занудна эта работа? Дежурный ответ -- смотря кому. Мне вот очень даже интересна, потому как я люблю решать задачки и узнавать новое про людей. Профессия data analyst комбинирует в себе оба этих занятия.

Уровень стресса, востребованность рынком. Опыт показывает, что уровень стресса связан, скорее, не со специальностью, как таковой, а с тем, как налажена и организована работа, подходит ли она работнику, и кто работает рядом с ним или с ней. Стресса в нашем отделе хватало, но меня он чаще не утомлял, а развлекал -- пока наши дела не стали плохи, тогда, конечно, не до развлечений становится.

Про востребованность рынком -- она вполне заметна, Спецы по анализу данных нужны практически везде: и в бизнесе, и в социальных науках, и в здравоохранении, и в безопасности. Это как бы вообще, а конкретно, пока наш отдел фурычил, нам постоянно были нужны люди. Они приходили и уходили, кто сам, а кто не сам. И надо сказать, что найти по-настоящему хорошего специалиста было нелегко.

И в заключении картинка на тему:

Текст тут такой. На первой картинке data analyst (знаменитый персонаж комиксов Dilbert) говорит: "У меня нет точных цифр, поэтому я взял их с потолка". На второй картинке он же продолжает: "Исследования показывают, что от точных цифр пользы не больше, чем от цифр, взятых с потолка." На третьей его спрашивают: "Сколько исследований показали это?", -- на что он отвечает: "87".
Wayne_George_turtle_t

Про obfuscation

На прошлой неделе случайно узнала новое английское слово: obfuscation. Мультиран даёт такие русскоязычные аналоги:

- затемнение; помутнение
- умышленное запутывание вопроса
- спутанность сознания; затемнение сознания; помутнение рассудка; спутанность сознания (помрачение сознания)
- умышленная непонятность

А вообще это термин, обозначающий приём, который, оказывается, бывает нужен при работе в IT, например, с базами данных. Реальный пример: нужно дать кому-то на сторону пробный кусок данных из собственных таблиц, который был бы, одновременно, правдоподобный и неверный. Не для того, чтобы специально запутать врага, а чтобы не разгласить лишнего нейтральному помощнику, главная цель которого -- сделать что-то полезное для нас же, используя эти данные.

Мерриам-вебстер говорит, что это слово произошло от латинского obfuscatus, и замечено в английском языке впервые в 1577 году. Вот ведь...
Wayne_George_turtle_t

Про Анжелу Байрон

Пришёл нам свежий (апрельский) номер Linux Journal с необычной для себя обложкой -- фотографией симпатичной девушки (говорят, первая женщина на обложке за все 204 выпуска):


Девушка заинтересовала, и я её погуглила. Ну, и интервью с ней прочитала. Зовут её Анжела (Энжи) Байрон. Получается, что однофамилица лорда Байрона, поэта; насчёт родственница ли, не знаю, но очевидно, что она достойная продолжательница дела его дочки, Ады Лавлейс, первой в мире программистки. Энжи живёт в Канаде (Ванкувере) и активно разрабатывает Drupal, начиная с 2005 года. У неё и ник занятный: webchick (вебчик). Вот её более крупный потрет:


Пару интересных и полезных фактов про неё.

Впервые она узнала про идею open source (свободное программное обеспечение, которое могут разрабатывать все, кому не лень) ещё будучи школьницей, но сама в это дело лезть не посмела -- у неё были представления, что в этой секте одни гении, а себя она к ним не причисляла. Через десять лет, когда она была уже студенткой, её пригласили в гугловский летний лагерь. Там она решила заняться друпалом -- потому что на нём был сделан сайт, продвигавший Firefox (а узнала она об этом, потому что имела привычку смотреть код интересных сайтов).

Она придумала, что будет делать, но не знала даже, с чего начать, тем более, что ни документации, ни книжек тогда особенно не было. Тогда она сделала очень интересный ход: пошла в группу поддержки, чтобы выяснить, что люди спрашивают, и что и как им отвечают те, кто знают. Через несколько недель она уже и сама получила репутацию эксперта. Одновременно стала писать документацию -- такую, которая была бы полезна ей самой. Ну, а в процессе избавилась от мифа, что только боги горшки обжигают пишут программы. Конечно, гении среди опенсорсников тоже попадаются, но большинство там вполне нормальные -- просто сильно увлечённые.

В результате, кроме всего прочего, она и книжку выпустила в команде, вот эту: Collapse )

PS В виде дополнения сделала пост в ru_herself: Программистки, там можно и на других коллег Энжи посмотреть (источник тот же).
Wayne_George_turtle_t

Про (самые популярные) газеты

При обсуждении предыдуыщего поста возникла побочная тема о газетах. И вот, что я обнаружила. Оказывается, есть сводная таблица сотни самых популярных (по тиражу) газет мира. Вот тут: The world's top 100 circulating newspapers. Там и другие таблица интересные есть.

Уж и не знаю, насколько можно доверять их базе данных, но получается, что самая многотиражная газета в мире -- японская "Асахи симбун" ("Восход солнца), она издаётся тиражом более девяти миллионов экземпляров. На втором месте тоже с очень впечатляющей цифрой тиража (более шесть миллионов) немецкая "Бильд". "Московский комсомолец" заключает десятку, в которую не входит ни одна из американских газет. Самая популярная из штатовских -- это "Уолл стрит джорнал", и в мире он всего на 18-м месте, после многих китайских, южно-корейских, японских и британских газет (и одной российской).

Список отдельно всех американских можно вот тут посмотреть: List of newspapers in the United States. Первые 25 (по тиражу) я себе тоже скопирую для памяти, а то говорят, скоро все они исчезнут как класс. Ну, в интернете они, конечно, останутся, но в бумажной форме им предрекают полную гибель. Collapse )

Замыкает этот список газета нашего штата. Ещё совсем недавно их у нас было две, но штат их не потянул, они слились и осталась одна, та, что была посильнее...

Интересно, что по сводному числу читателей газет первенство в мире держат как раз Штаты. И ещё интересно, что списке из 25 самых тиражных штатовских газет нет ни одного таблоида. Интересно, это потому что их отдельно считают, или они таки и впрямь не дотягивают до нормальных газет?
Wayne_George_turtle_t

Про Sybase

Пропал оказывается Sybase, съели его немцы из SAP AG: Software maker SAP completes Sybase acquisition. Н-да, sic transit gloria mundi...

Нет, конечно, физически он никуда не делся -- здание стоит, люди работают, продукты выпускают, начальство хорохорится и даже обещает пощипать Oracle (At TechWave, Sybase's Chen Promises No Products Left Behind), но, во-первых, это уже никакой не Sybase, а американское отделение европейского международного концерна, а во-вторых, кто им раньше мешал победить всех конкурентов?...

А как хорошо начинали! В далёком 1984 году собрались четыре чувака, точнее, три чувака и одна чувиха в доме у одного из них и сделали первую систему, в которой реляционная база данных (сама по себе большая и важная новинка на то время) обслуживала несколько компьютеров сразу. По сути, это "базоданновый сервер" (database server) с сетью компьютеров-клиентов. Полное название: Relational database management system (RDBMS). Из этой системы потом (после сделки с Майкрософтом) получилось то, что сейчас называется Microsoft SQL Server (дебильная, зато популярная база данных, по крайней мере, в Штатах, постоянно приходится с ней дело иметь).

Ну, а главное, наверное их достижение, по поводу которого как раз и уместо вспомнить латинскую поговорку о проходящей земной славе -- это незабвенный Power Builder. Ещё в 90-х в Штатах он был супер-горячим продуктом, и многие новоприбывшие из экс-Союза музыканты, футболисты и парикмахерши учили его на скоростных курсах и у продвинутых частников -- дабы переквалицироваться в программисты (даже я прочитала книжку PowerBuilder in 24 hours :)). И многие таки переквалифицировались, но большинству из них потом пришлось переучиваться на что-нибудь другое. Он ещё не совсем умер, конечно, но вряд ли его употребление будет расширяться, а вот процесс сужения рынка скорей всего продолжится...

И что интересно? Точнее, совсем не интересно, а просто противно. В англоязычном оригинале статьи в википедии названы все четыре основоположника компании и продукта, а в русской версии -- только два, Роберт Эпштейн (Robert Epstein) и Том Хаггин (Tom Haggin), причём, "выпали", кроме Марк Хоффмана (Mark Hoffman), ещё и Джейн Доти (Jane Doughty). Интересно, почему это к ним такая немилость? Подозреваю, это потому что "женщины -- не программисты" (реальная фраза, услышанная мой дочерью на интервью в Москве). Правда, Марк-то тут причём?...

Вот они, пионеры Sybase в свои лучшие времена: Collapse )
Wayne_George_turtle_t

Про северных оленей (и программистов)

Wayne_George_turtle_t

Надо бы в топ отправить...

Источник: http://abkhaziawar.livejournal.com/5640.html

Уважаемый Дмитрий Анатольевич!

Несмотря на то, что мы с Вами являемся можно сказать политическими оппонентами, да и к тому же Вы являетесь президентом той страны, которая оккупировала часть моей Родины, я хочу обратится к Вам с советом.

Может быть этот коммент Вы так и не увидите тут (т.к. мои комментарии в этом сообществе часто не раскрываются), но я приложу все усилия, чтоб он дошел до Вас по тем или иным каналам.

Думаю Вы уже в курсе того, что неизвестные хакеры устроили DDoS атаку на мои блоги, расположенные на livejournal.com, facebook.com, twitter.com, blogger.com. Кроме последнего все сервисы были повалены хакерами, которые по всем данным были из России.

Но это была не первая DDoS атака на мои блоги, в прошлом году мой блог на livejournal.com так же был под атакой, и не работал с октября 2008 года, по май 2009. Однако это не получило широкой известности и не было расследовано правоохранительными органами России, что видимо дало хакерам эффект вседозволенности.

Теперь же весь мир, с моих слов, говорит о том, что российские хакеры, которые по всей видимо на службе у правительства, могут, ради блокирования одного блоггера с иным мнением, закрыть доступ в большие социальные сети для миллионов человек.

Так вот, уважаемый Дмитрий Анатольевич!

Прошу Вас дать задание своим спецслужбам найти и исполнителей, и организаторов этой атаки, и показательно наказать, чтоб другим было неповадно.

Необязательно публиковать скриншот этой страницы с Вашей резолюцией, но сделайте это, для восстановления имиджа Вашей страны.

А то, Ваше ПВО сбивало во время войны Ваши же самолеты, которые бомбили Ваши же колонны, а некто Нагавицин, утверждает, что это грузины перекрашивали свои самолеты в цвета ВВС России и так бомбили..
Постыдились бы.

Итак, я Вас предупредил, господин президент.
Вы любите интернет, надеюсь Вы понимаете, как важно восстановить облик России после этой грязной атаки.

С Уважением
Георгий

http://community.livejournal.com/blog_medvedev/31093.html?thread=11773557#t11773557

http://www1.abkhaziya.net/2009/08/letter-from-cyxymu-to-russian-president.html

via taki_net, vaskodagala, diana_ledi и других :)
Wayne_George_turtle_t

Про Сару Шарп

Есть такая американская программистка Сара Шарп (Sarah Sharp) по прозвищу Geekess. Она работает в Интеле (Intel). А сегодня прошла новость, что для Линуха разработан первый драйвер под USB 3.0: Linux first to offer USB 3.0 driver, и что его сделала Сара Шарп. Драйвер готов уже сейчас, формальная поддержка начнётся в сентябре.

Вот такая она "гикесса" Сара по фамилим "Острая" :)



PS По первой ссылке можно попасть на персональный сайт Сары и взять там этот драйвер -- ну, если у кого уже есть третий USB и линукс впридачу.
Wayne_George_turtle_t

Про нового лауреата "нобелевской" премии по программированию

В информатике есть такая премия Тьюринга (Turing Award. Как пишет википедия, это "самая престижная премия в информатике, вручаемая Ассоциацией вычислительной техники за выдающийся научно-технический вклад в этой области". В этом году эту премию получила женщина, американка Барбара Лисков: Collapse )
Wayne_George_turtle_t

Рабочее (кое-какие странности SQL Server'а)

В общем, это может быть интересно разве что коллегам по специальности data analyst, да и то, только тем, кто работает вплотную с SQL Server-ом. Особенная надежда у меня в этом смысле на новую френдессу uro_da :) и на "старую" френдессу gem_in_i. Может, есть и другие спецы по этому делу у меня во френд-ленте, а я просто не знаю, так что колитесь :). Короче, нашла я что-то типа "бага", точнее, "неприятной особенности" SQL Server'а, которую пока что просто обошла :) Collapse )