スポナビのボックススコアにpandasのread_html()を使うことで簡単にデータを取得できます

環境

docker上にjupyterコンテナを起動すると楽

$ docker -v
Docker version 17.12.0-ce, build c97c6d6

$ docker-compose -v
docker-compose version 1.18.0, build 8dd22a9

$ cat docker-compose.yml
version: "3"
services:
  jupyter:
    image: jupyter/datascience-notebook
    ports:
      - "8888:8888"
    volumes:
      - jupyter_data:/opt/conda
      - jovyan_data:/home/jovyan
    container_name: jupyter
volumes:
  jupyter_data:
  jovyan_data:

ボックススコアの取得

スポナビのバスケページからボックススコアのURLを入手します
2017-18シーズン現在では
http://sportsnavi.ht.kyodo-d.jp/basketball/stats/[b1|b2|b3]/score/[試合通し番号]/box/[h|a]/
最後の[h|a]でホームチーム、アウェイチームのボックススコアが選択できます

pandasのread_html()で取得

import pandas as pd
tables = pd.read_html('http://sportsnavi.ht.kyodo-d.jp/basketball/stats/b1/score/1818/box/a/', flavor='bs4')

tables[0]で得点が、tables[1]で選手別の成績が取得できる

bleague-01.png
bannerAds