CentOSTwitter Streaming APIでMongoDBに溜めたツイートをJupyter NotebookからApache Sparkで読み込んでみた 今後の仕事で活かせるよう、今日はOSSを使って簡単なデータ基盤の構築してみたいと思います。使う技術は データソース:Twitter Streaming API、分散ストレージ:MongoDB、分散データ処理:Apache Spark、データ整形:pandas、対話的コンソール:Jupyter Notebook 2020.07.13CentOSDatabricksJupyterJupyter NotebookLinuxMongoDBPythonSparkやってみたデータ基盤ビッグデータ