Home > database >  web-scraping an unordered table
web-scraping an unordered table

Time:09-29

I'm trying to scrape with BeautifulSoup then print it out in Pandas, but the table I need to work with is having spans randomly every month.

"https://to.sze.hu/kezdolap" the top table in the middle div

The path is soup.select("#content > div:nth-child(2) > div > div > div > table")

CodePudding user response:

You can do:

df_list = pd.read_html('https://to.sze.hu/kezdolap', header=0)

Which will add your tables to a list, then simply:

df_list[0]

Gives you:

    Ügyfélfogadás NAPPALI tagozatos hallgatók számára (full time students)  Ügyfélfogadás NAPPALI tagozatos hallgatók számára (full time students).1    Ügyfélfogadás NAPPALI tagozatos hallgatók számára (full time students).2
0   2021. augusztus 25-augusztus 27./ 25. August -...   szerda/Wednesday    9.30-11.00
1   2021. augusztus 25-augusztus 27./ 25. August -...   csütörtök/Thursday  13.00-14.30
2   2021. augusztus 25-augusztus 27./ 25. August -...   péntek/Friday   13.00-14.30
3   2021. augusztus 30-szeptember 3./ 30. August -...   kedd/Tuesday    9.30-11.00
4   2021. augusztus 30-szeptember 3./ 30. August -...   csütörtök/Thursday  13.00-14.30
5   2021. augusztus 30-szeptember 3./ 30. August -...   péntek/Friday   13.00-14.30
6   2021. szeptember 6-17. / 06. September-17. Sep...   kedd/Tuesday    9.3011.00
7   2021. szeptember 6-17. / 06. September-17. Sep...   csütörtök/Thursday  13.0014.30
8   2021. szeptember 20-30. / 20-30 September 2021  kedd/Tuesday    10.0011.00
9   2021. szeptember 20-30. / 20-30 September 2021  szerda/Wednesday    10.0011.00
10  2021. szeptember 20-30. / 20-30 September 2021  szerda/Wednesday    13.0014.00
11  2021. szeptember 20-30. / 20-30 September 2021  csütörtök/Thursday  10.00 - 11.00
  • Related