Skip to content
5 changes: 2 additions & 3 deletions 404.html
Original file line number Diff line number Diff line change
@@ -1,6 +1,6 @@
---
permalink: /404.html
layout: default
layout: post
---

<style type="text/css" media="screen">
Expand All @@ -20,6 +20,5 @@
<div class="container">
<h1>404</h1>

<p><strong>Page not found :(</strong></p>
<p>The requested page could not be found.</p>
<p><strong>Страница не найдена :(</strong></p>
</div>
5 changes: 5 additions & 0 deletions _includes/nav.html
Original file line number Diff line number Diff line change
@@ -0,0 +1,5 @@
<nav style="display: flex; flex-direction: row; justify-content: space-around;">
<a href="/">Главная</a>
<a href="/about">Об авторе</a>
<a href="#mc_embed_signup">Подписаться</a>
</nav>
27 changes: 27 additions & 0 deletions _includes/subscribe.html
Original file line number Diff line number Diff line change
@@ -0,0 +1,27 @@
<!-- Begin Mailchimp Signup Form -->
<div id="mc_embed_signup">
<form action="https://github.us10.list-manage.com/subscribe/post?u=fca409e29bab69cb5b90aa126&amp;id=9e8221085c" method="post" id="mc-embedded-subscribe-form" name="mc-embedded-subscribe-form" class="validate" target="_blank" novalidate>
<div id="mc_embed_signup_scroll">
<h2>Подписаться на новые посты</h2>
<div class="mc-field-group">
<h3>Вариант 1:</h3>
<label for="mce-EMAIL">Email:</label>
<input type="email" value="" name="EMAIL" class="required email" id="mce-EMAIL">
</div>
<div id="mce-responses" class="clear">
<div class="response" id="mce-error-response" style="display:none"></div>
<div class="response" id="mce-success-response" style="display:none"></div>
</div> <!-- real people should not fill this in and expect good things - do not remove this or risk form bot signups-->
<div style="position: absolute; left: -5000px;" aria-hidden="true"><input type="text" name="b_fca409e29bab69cb5b90aa126_9e8221085c" tabindex="-1" value=""></div>
<div class="clear"><input type="submit" value="Отправить" name="subscribe" id="mc-embedded-subscribe" class="button">
</div>
</div>
<div>
<br>
<h3>Вариант 2:</h3>
<a href="https://t.me/artintelligence" target="_blank">Перейти в Телеграм-канал</a>
</div>
</form>
</div>

<!--End mc_embed_signup-->
11 changes: 8 additions & 3 deletions _layouts/home.html
Original file line number Diff line number Diff line change
Expand Up @@ -5,8 +5,11 @@
<html>
<head>
<title>{{ site.title }}</title>

</head>
<body>
{% include nav.html %}
<hr>

{{ content }}

Expand All @@ -20,8 +23,10 @@ <h3><a class="post-link" href="{{ post.url }}">{{ post.title }}</a></h3>
<hr>
{% endfor %}
</div>


{% include footer.html %}

<hr>
{% include subscribe.html %}
<br>
{% include nav.html %}
</body>
</html>
10 changes: 8 additions & 2 deletions _layouts/post.html
Original file line number Diff line number Diff line change
Expand Up @@ -8,12 +8,18 @@
<title>{{ site.title }}</title>
</head>
<body>
{% include nav.html %}
<hr>

<div class="container">

{{ content }}

</div><!-- /.container -->

{% include footer.html %}

<hr>
{% include subscribe.html %}
<br>
{% include nav.html %}
</body>
</html>
130 changes: 44 additions & 86 deletions _posts/2019-04-30-ocr.md

Large diffs are not rendered by default.

53 changes: 27 additions & 26 deletions _posts/2019-07-25-distinct-count.md

Large diffs are not rendered by default.

125 changes: 42 additions & 83 deletions _posts/2020-05-01-start.md

Large diffs are not rendered by default.

64 changes: 64 additions & 0 deletions about.markdown
Original file line number Diff line number Diff line change
@@ -0,0 +1,64 @@
---
layout: post
---

## Обо мне

<img src="/assets/images/me.jpg" alt="me" style="width:100px; height: 100px; float:left; border-radius: 50%; margin: 10px;">
Меня зовут Рустем Галиуллин. Работаю в сфере Data Science и реализую проекты с использованием технологий машинного обучения. Обладаю опытом работы со структурированными данными и анализа неструктурированной информации: текста, изображений и видео.

Я решил посвятить этот блог статьям о своих проектах для продукт-менеджеров, аналитиков и управленцев. В сети много материала с детальными техническими подробностями алгоритмов, которые будут полезны техническим экспертам, или маркетинговых статей в популярных медиа – для широкой публики. Этот блог может стать чем-то средним для людей, которые заинтересованы в применении технологий машинного обучения в своих проектах, но необязательно умеют или хотят программировать.

#### Опыт работы

- _2019 - по н.в._ Ведущий специалист Data Science, место - ОАЭ. Проекты связаны с анализом текстовых и медиа-данных из открытых источников информации
- _2019_ - Инженер-исследователь компьютерного зрения, место - Москва. Разрабатывал алгоритмы для обработки изображений и видео
- _2017-2019_ - Специалист Data Science, место - Казань, Россия. Решение задач, связанных с обработкой структурированных больших данных

#### Обучение и курсы

- Специлиазация Deep Learning [deeplearning.ai](https://www.deeplearning.ai/deep-learning-specialization/) (2018)
- Курс Deep Learning [Udacity](https://classroom.udacity.com/courses/ud730) (2018)
- Вводный курс [Analytics Edge](https://www.edx.org/course/the-analytics-edge) (2016)
- Магистратура [University of Arkansas](https://www.uark.edu), "Экономика и информационные системы" (2016)
- Бакалавриат [Казанского федерального университета](https://kpfu.ru), "Бухучет, анализ и аудит" (2014)

## О рабочих процессах

Здесь хочу поделиться некоторыми взглядами на реализацию проектов, которые я выработал за последние несколько лет.

#### Scrum и машинное обучение

Я часто слышу от самих дата-саентистов и тех, кто утверждает, что разбирается в профессии: скрам не применим в исследовательской работе. Они говорят, что разработка алгоритмов и весь исследовательский процесс не предсказуем и никак не может уложиться в двухнедельные спринты.

Наиболее частые проблемы, которые я наблюдал при таком подходе, – люди, ставившие задачи не могли получить ответ о сроках и скоупе работы. Часто финальный результат не совпадал с изначальными ожиданиями заказчика. Это легко себе представить: мировоззрение исследователя отличается от мировоззрения продукт-менеджера.

Я настаиваю на том, что применять скрам можно и нужно. Если саентисту описать пользовательскую историю и ожидаемый результат, то ему будет намного легче понять, какие методы применить можно, а какие нельзя. Какие будут ограничения и как в итоге будет использоваться обученная модель.

Да, невозможно обещать определенный уровень точности алгоритма или построения всего пайплана, начиная от сбора данных, завершая оценкой обученного алгоритма к концу спринта. Но можно определить методы и шаги, которые необходимо сделать в течение спринта, - это уже более четкая постановка задачи, на которую может "подписаться" дата-саентист.

| Плохие примеры | Хорошие примеры |
| :------------- | :------------- |
| Улучшить алгоритм распознавания лиц | Применить _center loss_ при обучение модели распознавания лиц |
| Исследовать алгоритмы анализа тональности текста | Собрать датасеты, метрики и подходы для обучения алгоритма анализа тональности |

Описание задач в этом случае не звучит как фича для пользователей. Однако дает исполнителю понять, какие результаты от него ожидает команда.

#### Netflix команды

Мне близка идея отношения между специалистами по модели _Netflix_. Их подход утверждает:
> "мы не семья, мы - команда!"

Это означает, что ты не обязан относится к членам команды, как к членам семьи, т.е. любить и поддерживать несмотря ни на что. Наоборот, команда разработчиков похожа на футбольную команду: в ее составе должны играть лучшие. Вся команда заинтересована в достижении результата. На основе этого происходит перераспределение бонусов и ресурсов. Заказчики требуют от членов команды результатов выше средних по рынку, и за это дают соответствующие вознаграждения.

#### Как стать дата саентистом?

Наиболее частый вопрос. Видимо он связан с некоторым хайпом вокруг профессии. Думаю не бывает, что человек занимается чем-то совсем иным, затем резко решает освоить новые навыки программирования, статистики и математики и идет работать специалистом по машинному обучению. Чаще происходит по следующему сценарию: работая в смежной специальности, возникает необходимость применения методов машинного обучения или статистики, проявляется интерес и вовлеченность. Дальше возникает желание изучить эту дисциплину поглубже.

Действенный способ достижения успеха в какой-то сфере описан в книге ["So Good They Can't Ignore You"](https://www.amazon.com/Good-They-Cant-Ignore-You/dp/1455509124). Автор утверждает, что подход _"бросить все и следовать мечте"_ таит множество подводных камней и в корне неправильный. Напротив, _Cal Newport_ предлагает другой алгоритм достижения успеха: полюбить то, чем занимаешься и научиться делать это лучше. Затем начать копить карьерный капитал и контролировать свой карьерный путь. В какой-то момент твоя ценность для работодателя значительно превысит его уровень его предложения.

## Контакты

- <a href="https://t.me/rusteam11" target="_blank">Telegram</a>
- [Email](mailto:rustemgal@gmail.com)
- <a href="https://github.com/Rusteam" target="_blank">GitHub</a>
Binary file added assets/images/me.jpg
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.