CentOSTwitter Streaming APIでMongoDBに溜めたツイートをJupyter NotebookからApache Sparkで読み込んでみた 今後の仕事で活かせるよう、今日はOSSを使って簡単なデータ基盤の構築してみたいと思います。使う技術は データソース:Twitter Streaming API、分散ストレージ:MongoDB、分散データ処理:Apache Spark、データ整形:pandas、対話的コンソール:Jupyter Notebook 2020.07.13CentOSDatabricksJupyterJupyter NotebookLinuxMongoDBPythonSparkやってみたデータ基盤ビッグデータ
AzureAzure Databricksでデータを整形&統合&可視化する方法 こんにちは。やましー@データ活用クラウドエンジニア(@yamashi18041) です。 今日は前回書いた「Microsoft Azure Databricksを使ってデータレイクのデータを表示する方法」で使用した教材、Mi... 2020.01.16AzureDatabricksMicrosoftやってみたクラウドデータ基盤
AzureMicrosoft Azure Databricksを使ってデータレイクのデータを表示する方法 こんにちは。やましー@データ活用クラウドエンジニア(@yamashi18041)です。 今日は前回書いた「Microsoft Azure Data Factoryを使ってデータ基盤にデータを取り込む方法」で使用した教材、M... 2020.01.11AzureDatabricksMicrosoftやってみたクラウドデータ基盤