Skip to content

Phate334/box-office-tw

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

每週全國票房

Build Status

這個專案目標是取回 OpenDataTFI 公布的每週票房資料,並轉為 JSON 格式。

首頁表格顯示取回檔案中最新一週的資料,可以排序、過濾。目前的 json 檔只有轉換 OpenData 公布的 csv 格式檔案,放在 TFI 上更早的 xlsxpdf 還沒轉換。

API

所有資料都放在 /docs 目錄下,包括下載的原始資料及轉換過的 json 檔。

JSON

["20190506-20190512"]
[
  {
    "序號": 1,
    "國別地區": "南韓",
    "中文片名": "親愛的仇人",
    "上映日期": "2019/05/04",
    "申請人": "可樂藝術文創股份有限公司",
    "出品": "M-Line Distribution",
    "上映院數": 14,
    "銷售票數": 966,
    "周票數變動率": "5,266.67%",
    "銷售金額": 217475,
    "累計銷售票數": 984,
    "累計銷售金額": 220515
  }
]

Source data

{
  "20190513-20190519": {
    "pdf": "https://www.tfi.org.tw/Content/TFI/PublicInfo/全國票房2019年0513-0519統計資訊.pdf",
    "xlsx": "https://www.tfi.org.tw/Content/TFI/PublicInfo/全國票房2019年0513-0519統計資訊.xlsx"
  }
}
{
  "20190506-20190512": {
    "csv": "https://opendata.culture.tw/upload/dataSource/2019-05-16/9b5f358f-9263-4cc7-b0cf-201ea4633680/994a6d972ceaa26f6356df4fb61cd60d.csv"
  }
}

資料清理紀錄

紀錄轉換成 json 過程額外處理的內容

  1. 部分檔案開頭有 unicode BOM

    • source/opendata/20180730-20180805.csv
    • source/opendata/20180806-20180812.csv
    • source/opendata/20180813-20180819.csv
    • source/opendata/20180820-20180826.csv
    • source/opendata/20180827-20180902.csv
    • source/opendata/20180903-20180909.csv
    • source/opendata/20180910-20180916.csv
    • source/opendata/20180917-20180923.csv
    • source/opendata/20180924-20180930.csv
    • source/opendata/20181001-20181007.csv
    • source/opendata/20181008-20181014.csv
  2. 每筆資料最後多一個逗點,被多判斷成一個空欄位

    • source/opendata/20180924-20180930.csv

放在數值轉換一起處理,刪除多餘的空欄位

  1. 方便後續應用,票數、金額包括序號都去除逗號並轉為整數型態。

欄位定義

  • column-defines.json

用在顯示 Ag-Grid 的設定檔。

  • 票數變動率的欄位名稱沒統一,目前還沒處理所以沒放進去。
    • 周票數變動率
    • 本周票數變動率
    • 票數變動率
    • 本周票數變動
    • 周票數變動率
    • 票數變動率

About

🎥 每週全國電影票房資料

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages