Python程式基礎與網路爬蟲課

Python程式基礎與網路爬蟲課

課程大綱

課程訓練目的:

建立使用 Python 處理、分析結構化、半結構化與非結構化資料的能力,讓學員瞭解正確的觀念與方法。

教學課程大綱:3/28~3/29;4/1;4/3;4/8;4/10

1 1. Python 基礎

1.1. 變數型別

1.2. 流程控制

1.3. 函數

1.4. 資料結構:list、tuple

1.5. for 迴圈

1.6. 流程控制

1.7. 資料結構:dict、set

1.8. while 迴圈

1.9. 自訂函數

1.10. 模組與套件

2. 網站擷取入門

2.1. 靜態網頁擷取:pyquery

2.2. 動態網頁擷取:selenium

3. 網站擷取實作

3.1. IMDB

3.2. 批踢踢實業坊

3.3. 591 房屋網

3.4. Yahoo! 奇摩股市

3.5. 公開資訊觀測站

課程簡介

在這門課程將從 Python 基礎語法開始教起,並穿插講解如何透過支援 Python 的模組實踐網站擷取技術,從網站來源獲取資料後,做資料的清理與整併。學員不僅能夠學會 Python 基本程式設計,更能夠建立網路爬蟲來擷取網頁資料。課程內容搭配實作範例與練習,強化對於 Python程式語言的理解。

課程將以 Anaconda 建立資料科學環境,使用 Jupyter Notebook 進行開發,並且利用 pyquery 與 selenium 進行資料的擷取以及清理。

課程大綱

課程訓練目的:

建立使用 Python 處理、分析結構化、半結構化與非結構化資料的能力,讓學員瞭解正確的觀念與方法。

教學課程大綱:3/28~3/29;4/1;4/3;4/8;4/10

1 1. Python 基礎

1.1. 變數型別

1.2. 流程控制

1.3. 函數

1.4. 資料結構:list、tuple

1.5. for 迴圈

1.6. 流程控制

1.7. 資料結構:dict、set

1.8. while 迴圈

1.9. 自訂函數

1.10. 模組與套件

2. 網站擷取入門

2.1. 靜態網頁擷取:pyquery

2.2. 動態網頁擷取:selenium

3. 網站擷取實作

3.1. IMDB

3.2. 批踢踢實業坊

3.3. 591 房屋網

3.4. Yahoo! 奇摩股市

3.5. 公開資訊觀測站

目標對象

必須具備 Python 程式語言基礎

具備基本的電腦操作能力

對網站爬程有興趣者

對欲往大數據產業發展者

基本能力需求

必須具備 Python 程式語言基礎

具備基本的電腦操作能力

對網站爬程有興趣者

對欲往大數據產業發展者

注意事項

課程諮詢專線:02-7732-6688轉分機8536或總機0 (服務時間:週一至週五10:00-19:00)

報名繳費專線:02-7728-5700轉9(服務時間:週一至週六 09:00-21:00;星期日09:00-18:00)