every Tech Blog

株式会社エブリーのTech Blogです。

エブリーのインターンに参加してみた

はじめに

はじめまして。2020年3月からエブリーでインターンをしている田村です。
私はデータエンジニア・データサイエンティストとしてインターンシップに参加し、データ関連部門に配属され、データ業務を担当しています。
今回は、エブリーにインターンとして入社し約4ヶ月間で感じたことをまとめていこうと思います。

目次

1.エブリーのインターンに参加した経緯

2.インターンを通して学んだこと

1.エブリーのインターンに参加した経緯

私は機械学習を主とする統計分野に興味があり大学院に進学したのですが、査読した論文を検証できるデータを保持するインターン先を探す中で、DELISH KITCHENを運営しているエブリーと出会いました。 面談の前にオフィスツアーをしたのですが、まず驚いたのは東京タワーの見える六本木グランドター38階のオフィスです。
食のメデイアを運営していることから、本格的なキッチンスタジオがあり、フードスタイリストの方が日々料理動画を撮影しています。

f:id:kthimuo:20201008145828j:plain

作業エリアは集中できる雰囲気なことや、CTOとのカジュアル面談時に大量のデータを扱うことが出来そうだと期待してインターンとして入社することに決めました。

2.インターンを通して学んだこと

私がデータエンジニアとしてインターンの業務を通じて学んだことを書いてみます。  

・DIKW

まず、初日にデータチームのマネージャーに教えられたことはDIKWモデルというデータがどのように事業に貢献するかというモデルです。詳しい記事はこちらをご覧ください。

・Arm Treasure Data / Databricks / Redashなどのデータプラットフォーム

DELISH KITCHENのログデータの分析だけでも膨大な量で、これらのビッグデータを処理できる計算基盤が必須です。
所属しているデータ部門では、Databricksと呼ばれるApache Sparkをバックエンドとした分析プラットフォームを用いて、データクレンジングなどの前処理や機械学習の処理を実装しています。
またこちらの記事でもあるように、sql,scala,pythonなどの複数の言語を組み合わせて処理を書けるためこれらの言語の基本文法はマスターできました。学校ではPythonを利用した研究開発だけを実装しており、Python以外の言語に触れる機会が無かったのですが、SQLが特に重要だと教えられ、今では自分のやりたい事は大体実現できるようになりました。
インターン生でもエブリーの全てのデータに自由にアクセスでき、分析する基盤まであるのはとても良い環境だと思います。

・他部門との連携

私の所属するデータ関連部門では、エブリーが運営している複数のメディアから発生するデータ分析依頼や要望を引き受けています。
「●●を知りたい」などの抽象的な課題を具体的な課題に落とし込んだ後、どんなデータを提供したら良いのか、どんな見せ方をしたらいいのかを考え、Redashのダッシュボードを提供したり統計的な手法で知見を伝えたりします。
他部門の業務を経験が浅いインターンが他部門の業務や課題を理解するのは難しいですが、エブリーではインターン生も他部門の議事録や組織図をconfleneceやカオナビで把握できます。

・リモート環境

コロナの影響でエブリーでは3月からインターンも含めリモートワークを推奨しています。
私もリモートでのインターンは初めてで、移動時間がなくなったり服を選んだりする手間がなくなったりメリットが多いなと思いました。意思疎通が対面よりもスムーズにできないという問題がありますが、私のチームでは毎日30分程のミーティングを行い、課題の共有やコミニケーションを行うようにしています。
会議に参加できなくても録画しておけば後から見直せるので便利です。
最近では半年に1回の社員総会もリモートで行いこちらに詳しい記事があります。

最後に

エブリーではデータ関連部門以外でもエンジニアのインターンを募集しています。
メディアの運営に携わってみたい、アプリの開発に携わってみたいという方はこちらをご覧ください。