Об эмпирическом анализе и эконометрике
ens_a_se
Ввиду недавних событий, занимаюсь я после работы и по выходным чтением статей по эмпирическому анализу, а также делаю анализ сам на данных по Японским компаниям используя STATA. Так вот что удивительно относительно статей в этой области:
1. Не опубликованы: много статей не издано ни в каком журнале, а лишь working paper of international monetary fund/world bank/etc. Большинство статей которые все-таки в журнале - не в high ranked journals. Может гугл выдает не те статьи? Я хз.
2. Оформление статей: часто крупный шрифт, полуторный или двойной интервал и целые страницы под таблицы.
3. Теор база: мне кажется обычно (может быть от необразованности в экономике), что раздел теоретический базис и раздел эмпирический анализ - не имеют ничего общего. То есть они пишут какие-то супер общие модели в теории с кучей формул и коэффицентов, а затем никогда не ссылаются на них в эмпирическом анализе. А так можно вообще?

У меня лично возникают сложности с интерпретацией графиков и таблиц, которые я получил. Например, я сравниваю два кластера - экспортеров и не экспортеров. Для каждой компании у меня есть отношение ALP= revenue/number_employees. Если поделить mean value для всех экспортеров на mean value для всех не экспортеров, то для всех индутрий получаются некие цифры, почти для всех больше 1. Заключаю, что в целом - по этому критерию эффективности - экспортеры во всех отраслях эффективнее. И еще могу сказать, что особенно это заметно у Transportation, communication, electric, gas индустрий (в основном, естественные монополии - японская РЖД, японские газовые и электрокомпании). Но вот почему особенно у них? Я не знаю какую интерпретацию дать. Получается, что выручка на человека в естественных монополиях выше, чем в других местах. Либо у них всегда выручка выше, а людей меньше и потому нельзя сравнивать ALP для одной индустрии с ALP для другой?
Далее, для производителей (manufacturers) получается что экспортеры имеют ниже выручку на человека чем не экспортеры. И вот почему? Я посмотрел на производителей подробнее - разбив их на группы (машины, измерительные приборы, химия и тп) - для всех групп получается тоже самое. Хрен пойми вот почему.

Самообразование
ens_a_se
Я тут в очередной раз задумался о планировании самообразования. Как всегда, есть ограничение по времени и потому было бы интересно ваше мнение что важнее, а что - нет. Цель - в конечном итоге повысить свою конкурентоспособность на момент окончания PhD. Так как мое PhD по computational biophysics, только самой этой степени, боюсь, будет маловато. Хотелось бы найти работу в области где пересекается матан и программирование.
Итак, что я изучил за последние полтора года:
1) Computer vision - так называемые вариационные методы и связанные с ними алгоритмы - shape from shading, bilateral filtering, retinex, etc (выложил код на гитхабе). То есть я знаю некоторые методы и некоторые алгоритмы, но широта кругозора не велика.
2) Shape analysis - тоже вариационные методы, метрические пространства, функан и тд. Применяется для сопоставление геометрических объектов, поиска по геометрическим объектам (например, по 3D скану лица найти человека).
3) Matlab - изучил не вдаваясь сильно в детали примудрости, могу быстро прототипировать на нем.
4) Python - довольно активно стал использовать как основной скриптовый язык для преобразования форматов, простого анализа данных, работы с файловой системой и тд. Но знаю язык не глубоко.
5) Немного изучил Blender, могу делать простую трехмерную анимацию, рисовать всяческие сетки.

Теперь о том куда идти:
1) Углубить знания в одной из перечисленных выше областей, ввиде того, что в каждой из них я не могу сказать, что я глубоко разбираюсь. Или это не особенно важно? Допустим, если я буду искать работу в области обработки изображений - достаточно ли того, что я прочел и реализовал 7-10 довольно продвинутых алгоритмов? Или нужно иметь законченную картину области в голове?
2) Изучить CUDA - тут есть коллега, который делает контору по обучению этой технологии. Можно воспользоваться его материалами и, так сказать, экспертной оценкой моих решений его задач. Нужно ли это или работодатель понимает, что небольшое дело изучить еще одну технологию?
3) Пойти на курс по финансовой математике. Я могу воспользоваться тем, что я в академии и посещать курс по Asset Pricing или по Timeseries Data Analysis. Будет ли мне это в плюс?
4) Повторить классические алгоритмы и структуры данных. Типо там сесть и реализовать основные сортировки, алгоритмы на графах, и прочее. Полезно ли сейчас или лучше отложить до того момента как защита будет ближе?
5) Участвовать в top coder - вспомнить каково это олимпиадное программирование. Это кто-то кроме гугла спрашивает еще? Стоит сейчас заниматься или отложить?
6) У меня есть пробелы в знаниях в многопоточности (я тут использую многопроцессность и MPI), стоит ли потратить время на этот аспект и на каком уровне нужно разбираться в этой теме?
7) Альтернативный вариант - сделать какое-нибудь маленькое приложение/коммит в библиотеку с открытым исходным кодом, полезное людям. Какое именно - не знаю. Но, например, реализовать какой-нибудь фильтр в OpenCV. Или сделать простое приложение для Андроида (но с другой стороны, я не хочу конкурировать с многчисленными андроид девелоперами).
8) Ничего такого не изучить, заниматься только своей научной работой. Для того, чтобы закончить с как можно большим количеством публикаций по теме молекулярной физики, выч биологии.

(no subject)
ens_a_se
Пока на Украине революция, некие неизвестные мне пацаны делают дополненную реальность. Местами сайт у них с дохлыми линками, но в целом - занятно.
http://augmentedpixels.com/about/

Посещаемость персонального блога и моего резюме
ens_a_se
Чуть более года назад я завел свой блог на рабочие темы на github. Туда я пишу о всяких алгоритмах которые я недавно имлементировал. Так же я создал там же страницу About и разместил там CV. Я не ищу работу, разместил просто чтобы было. Смотрю посещаемость через Google web master tools - с ноября статья Seam Carving набрала 132 клика, в то время как About/CV - 0 кликов. Вопрос - как увеличить посещаемость своего резюме? Большинство читателей приходит через поиск гугла. Это, вероятно, студенты, либо ученые. Хотя сложно сказать наверняка. Каков профиль посетителя который будет смотреть резюме? HR или team lead? Не ясно что и как они гуглят и ищут ли вообще по блогам кого-то. Может быть ищут через github? Но вот как-то сомневаюсь, по-моему смотрят больше всего linkedin

О titles в европе
ens_a_se
Всяческие профессора испытывают странную любовь к регалиям - хлебом не корми, дай добавить к своему имени какую-нибудь аббревиатуры. Встретил тут подпись - Имя Фамилия BSc PhD ... ..... Многоточие - не известные мне аббревиатуры, наверное мембер боард чего-нибудь. Подписывает так письма. Вот мне так интересно - что у он бакалавр наук - это важная инфа, а то я думал сразу после садика в пхд пошел.
Так же мне нравится чисто европейская фигня везде писать о наличии у себя высшего образования - главный архитектор Dipl. Eng. Такой-то. Ясный ж хрен, что если он строит дома то у него есть образование, не? Или пишут Итальянцы Dott. БлаБла. Это значит что у него есть высшее образование. Ну вот ахренеть не встать какая редкость и какой важный чувак вообще! Не просто продавец трусов, а с дипломом. Три года учился рекламе и туризму. Смерды должны падать на колени перед его дверью.

случайные мысли о том, в чем я уже не смыслю
ens_a_se
Хотел было написать комментарий к посту utasss, но как-то расписался-расписался и решил сделать пост. А то пишу редко.
Я уже 2 года как отошел от коммерческой разработки на Родине. И теперь как бы смотрю со стороны:
1) О Российской специфике: в России программист это крутая профессия, вроде как много получают, могут легко менять работу, ездят за бугор. Далее, они у нас, как правило, сами научились программировать. В универе мало кто научился. В Европе это не так. Тут это просто работа. Как бухгалтер. Учился в техунивере 3 года вебу, сетям и ОС (нет никакого матана, матлогики и прочего), пошел работать. На работе применяешь полученные в универе навыки. Программистов много, они как реально кидают гавно и мало кто претендует на дартаньянство. Зачем нужен Дартаньян в обычной embeded system или разработке веб сайтов на заказаз, или для дизайна IU? В среднем, нужен просто работник.
2) Как следствие из 1 - у нас многие из тех, кто работает программистом не на своем месте. Они могли работать математиками-аналистами в инвест банке, инженерами при проектировании чего-нибудь, или даже заниматься наукой (я вот должен был, напротив, остаться программистом :-) ). Но вынуждены были стать программистами под давлением среды. Я жил в академе - другой работы за норм бабло просто нет.
3) Программисты похожи. Я раньше и не думал в каком именно моменте - мы очень редко могут перерасти КАК и работать над ЧТО. Поэтому тратим свободное время на зубрежку очередного фреймворка, переписывают очень-полезное-приложение с языка А на язык Б, пишем никому не нужные либки на гитхаб. То есть как бы мы хотим что-то сделать полезное сами, но смотрим не туда. Сужу по своему опыту :-(
4) В какой-то момент программистам надоедает задрачиваться в фреймворках и тд. Они устают. Не видят смысла. Предпочитают больше тратить времени на семью, потому что тут результат очевиден. Либо даже уходят из активного девелопмента. От выучивания очередного языка пользы меньше чем кажется. Через несколько лет программирования уже совершенно не важно на чем писать, языки учатся рантайм по аналогии. Фреймворков много и они приходят и уходят. Мало смысла учить что-то в деталях на самом деле. Ибо не от фреймворка зависит успех приложения.

Curvature flow in curvature space
ens_a_se
Написал давече имплементацию метода из статьи с Сиграфа13. Curvature flow in curvature space.

Поисковый движок для полигональных сеток
ens_a_se
Наткнулся на поисковый движок по сеткам. То есть в рассмотрение берется именно геометрия, а не метаинформация. Можете поиграться сами - http://shape.cs.princeton.edu/search.html
Довольно забавно - ищет не супер быстро и не аккуратно. Но находит действительно похожие обьекты. Код закрыт ;-(

Seam carving
ens_a_se
Seam carving - это алгоритм для умного image resizing.
Примеры внизу:
Сжали картинку в горизонтальном измерении:

Удалили помеченный объект:

Я написал пост с описанием алгоритма. Буду рад замечаниям.

Ментальный переход из исполнителя в создателя
ens_a_se
Думаю я о переходе на следуйщий уровень сознания. Идея материализовалась в связи с игрой на гитаре.

Я много лет играю на этом инструменте, и достиг определенных успехов. Последние три года, ввиду отстутствия коллектива, я играл cover на разные композии. Выбирал все более сложные - начал с Children of Boddom- Every time I die, потом разучил Al di Meola - Egyptian Danza, недавно осилил Mars Volta - Eriatarka, Opeth - Serenity painted death. Последние две - очень сложные. Там и ломанные ритмы и разные техники игры и сложные композиции. Так вот, после них я уже вполне доказал сам себе, что могу с запомнить и сыграть почти все что угодно. То есть предел достигнут. Но я ведь ничего не сочиняю сам, я только исполняю. Собственно, здесь-то и место качественному скачку - от исполнения чужих композиций к написанию своих. Для этого я начал учить элементарную теорию музыки. И как заныво учусь ходить - играю очень простые вещи, но анализирую какие ноты, аккорды и почему и в каких позициях.

Обобщая эту идею и переходя к работе - здесь я то же исполнитель. То есть я могу по какой-то имеющейся задаче сделать имлементацию. Или даже в плане науки - прочитав кучу статей понять, что там-то не сделана такая-то маленькая оптимизация в таком-то алгоритме и сделать ее. Но даже алгоритмы - это кирпичики для решения задачи, такие же tools как все остальное, может иногда сложные. Переход к тому, чтобы самому ставить задачи и решать - это и должен быть аналогичный качественный скачок.

При кажущейся простоте идеи - этот ментальный переход делают далеко не все. Что мешает? Сложно сказать. Что до меня, то ситуация примерно такая. Допустим я не знаю что делать и имею свободное время. По-хорошему, я знаю что мог бы, допустим, запилить какую-то может не большую но полезную программу, сколоборировашись с кем-то. Но я не знаю какую именно, не знаю что мне с этого будет, не знаю какая из задач лучшая, не уверен что доведу до конца, и тп. То есть разные сомнения и неуверенность при налачии многих альтернатив.

You are viewing ens_a_se