sql >> Databasteknik >  >> RDS >> Mysql

Tillgång till en specifik tabell i HTML-taggen

Det ser ut som att problemet med alecxes kod är att den returnerar en tabell som är ett direkt syskon till h2, men den du vill ha ligger faktiskt inom en div (som är h2s syskon). Detta fungerade för mig:

import requests
from bs4 import BeautifulSoup

urls = [
    'https://www.hl7.org/fhir/valueset-account-status.html',
    'https://www.hl7.org/fhir/valueset-activity-reason.html',
    'https://www.hl7.org/fhir/valueset-age-units.html'
]


def extract_table(url):
    r = requests.get(url)
    soup = BeautifulSoup(r.content, 'lxml')

    h2 = soup.find(lambda elm: elm.name == 'h2' and 'Content Logical Definition' in elm.text)
    div = h2.find_next_sibling('div')
    return div.find('table')


for url in urls:
    print extract_table(url)



  1. Hur gör mysql omvänd upplösning av IP-adresser?

  2. PHP-bilaga i e-post är tom

  3. Betydelse av id =LAST_INSERT_ID(id)

  4. Hur man importerar MySQL-databaser på kommandoraden