database-lookup

Par mkurman · zorai

npx skills add https://github.com/mkurman/zorai --skill database-lookup

name: database-lookup description: Recherchez dans 78 bases de données scientifiques, biomédicales, des matériaux et économiques publiques via leurs API REST et retournez des résultats JSON structurés. Couvre physique/astronomie (NASA, NIST, SDSS, SIMBAD, Exoplanet Archive), terre/environnement (USGS, NOAA, EPA, OpenWeatherMap), chimie/médicaments (PubChem, ChEMBL, DrugBank, FDA, KEGG, DailyMed, ZINC, BindingDB), science des matériaux (Materials Project, COD), biologie/génomique (Reactome, BRENDA, UniProt, STRING, Ensembl, NCBI Gene, GEO, GTEx, PDB, AlphaFold, InterPro, ChEBI, BioGRID, Gene Ontology, QuickGO, NCBI Protein/Taxonomy, dbSNP, SRA, ENA, gnomAD, UCSC Genome, ENCODE, JASPAR, MouseMine, PRIDE, LINCS L1000, Human Protein Atlas, Human Cell Atlas, RummaGEO, Metabolomics Workbench, EMDB, Addgene), maladie/clinique (COSMIC, Open Targets, ClinPGx, ClinicalTrials.gov, OMIM, ClinVar, GDC/TCGA, cBioPortal, DisGeNET, GWAS Catalog, Monarch, HPO), réglementaire (FDA, USPTO, SEC EDGAR), économie/finance (FRED, BEA, BLS, Federal Reserve, World Bank, BCE, Trésor US, Alpha Vantage, Data Commons), et démographie (Recensement US, Eurostat, OMS). Utilisez cette compétence chaque fois que l'utilisateur souhaite rechercher des composés, médicaments, protéines, gènes, voies, enzymes, expression génique, variants, essais cliniques, brevets, dépôts SEC, indicateurs économiques, structures cristallines, objets astronomiques, tremblements de terre, météo, ou toute donnée issue d'une API de base de données publique. Déclenchez aussi lorsque l'utilisateur mentionne une base de données par son nom ou pose des questions sur les propriétés moléculaires, interactions drug-target, affinités de liaison, interactions protéiques, appartenance aux voies, pharmacogénomique, séries chronologiques économiques, propriétés des matériaux, composés disponibles dans le commerce, criblage virtuel, accessibilité des composés, bibliothèques chimiques, blocs de construction, génomique du cancer, mutations somatiques, profils de mutations tumorales, séquences nucléotidiques, assemblages de génomes, lectures de séquençage, accessions ENA, données INSDC, ou souhaite effectuer un recoupement d'entités entre sources. tags: [scientific-skills, database-lookup, api, cheminformatics, clinical, finance, react, database, bioinformatics, search, compliance] metadata: skill-author: K-Dense Inc. ---|---| | Objets géocroiseurs, astéroïdes | NASA (NeoWs) | — | | Images du rover Mars | NASA (Mars Rover Photos) | — | | Exoplanètes, paramètres orbitaux | NASA Exoplanet Archive | — | | Objets astronomiques par nom/coordonnées | SIMBAD | SDSS | | Spectres/photométrie de galaxies/étoiles | SDSS | SIMBAD | | Constantes physiques | NIST | — | | Spectres atomiques, raies spectrales | NIST (ASD) | — |

Sciences de la terre et de l'environnement

L'utilisateur demande des informations sur... Base(s) de données primaire(s) À considérer aussi
Tremblements de terre, événements sismiques USGS Earthquakes
Données sur l'eau, débits fluviaux, eaux souterraines USGS Water Services
Météo (actuelle, prévisions, historique) OpenWeatherMap NOAA
Données climatiques, stations météo historiques NOAA (CDO)
Qualité de l'air, rejets toxiques EPA (Envirofacts)

Chimie et médicaments

L'utilisateur demande des informations sur... Base(s) de données primaire(s) À considérer aussi
Composés chimiques, molécules PubChem ChEMBL
Propriétés moléculaires (poids, formule, SMILES) PubChem
Synonymes de médicaments, numéros CAS PubChem (synonymes) DrugBank
Données de bioactivité, IC50, essais de liaison ChEMBL BindingDB, PubChem
Affinités de liaison des médicaments (Ki, IC50, Kd) ChEMBL, BindingDB PubChem
Interactions drug-target ChEMBL, DrugBank BindingDB, Open Targets
Ligands pour une cible protéique (par UniProt) BindingDB ChEMBL
Identification de cible à partir de la structure du composé BindingDB (similarité SMILES) ChEMBL
Étiquettes de médicaments, événements indésirables, rappels FDA (OpenFDA) DailyMed
Étiquettes de médicaments (étiquettes de produits structurées) DailyMed FDA (OpenFDA)
Pharmacologie, indications des médicaments DrugBank FDA
Recoupement chimique PubChem (xrefs) ChEMBL
Composés disponibles dans le commerce pour le criblage ZINC PubChem
Recherche de similarité/sous-structure (achetable) ZINC PubChem, ChEMBL
Bibliothèques de composés drug-like, blocs de construction ZINC
Structures de médicaments approuvés par la FDA ZINC (fda subset) PubChem, FDA
Accessibilité des composés, catalogues de vendeurs ZINC

Science des matériaux et cristallographie

L'utilisateur demande des informations sur... Base(s) de données primaire(s) À considérer aussi
Matériaux par formule ou éléments Materials Project COD
Bande interdite, structure électronique Materials Project
Structures cristallines, fichiers CIF COD Materials Project
Propriétés élastiques/mécaniques Materials Project
Énergie de formation, thermodynamique Materials Project
Paramètres de maille, groupes d'espace COD Materials Project

Biologie et génomique

L'utilisateur demande des informations sur... Base(s) de données primaire(s) À considérer aussi
Voies biologiques Reactome, KEGG
Voies auxquelles appartient un gène/protéine Reactome (mapping), KEGG
Cinétique enzymatique, activité catalytique BRENDA KEGG
Études de métabolomique, profils de métabolites Metabolomics Workbench PubChem
Recherche m/z ou masse exacte Metabolomics Workbench (moverz/exactmass) PubChem
Séquence protéique, fonction, annotation UniProt Ensembl
Interactions protéine-protéine STRING BioGRID
Information génique, localisation génomique NCBI Gene Ensembl
Séquences de génome, variants, transcrits Ensembl NCBI Gene
Ensembles de données d'expression génique GEO (NCBI E-utilities)
Expression génique entre tissus GTEx Human Protein Atlas
Signatures d'expression génique (CMap/L1000) LINCS L1000 GEO
Enrichissement d'ensembles de gènes vs GEO RummaGEO GEO
Séquences protéiques (NCBI) NCBI Protein UniProt
Classification taxonomique NCBI Taxonomy
Données SNP/variant (dbSNP) dbSNP ClinVar, gnomAD
Fréquences de variants dans la population gnomAD dbSNP
Métadonnées de lecture de séquençage SRA ENA, GEO
Séquences nucléotidiques (archive européenne) ENA SRA, NCBI Gene
Assemblages de génomes, lectures brutes (européenne) ENA SRA, Ensembl
Recoupements à partir d'accessions de séquences ENA (xref) NCBI Gene, UniProt
Annotations de génome, pistes UCSC Genome Browser Ensembl
Structures protéiques 3D (expérimentales) PDB (RCSB) EMDB
Structures protéiques 3D (prédites) AlphaFold DB PDB
Cartes EM, structures cryo-EM EMDB PDB
Familles protéiques, domaines InterPro UniProt
Entités chimiques (biologiques) ChEBI PubChem
Interactions protéine/génétiques BioGRID STRING
Annotations de fonction génique (termes GO) QuickGO Gene Ontology
Éléments régulateurs, ChIP-seq, ATAC-seq ENCODE
Profils/motifs de liaison TF JASPAR ENCODE
Expression protéique entre tissus Human Protein Atlas UniProt
Projets d'atlas unicellulaires Human Cell Atlas
Ensembles de données de protéomique PRIDE
Données géniques souris MouseMine NCBI Gene
Répertoire de plasmides Addgene

L'organisme/espèce compte. La plupart des bases de données biologiques couvrent plusieurs organismes. Si la requête de l'utilisateur concerne un organisme spécifique, transmettez-la explicitement — ne supposez pas l'humain. Modèles courants : Ensembl utilise {species} dans le chemin URL (par ex. homo_sapiens), STRING/BioGRID/QuickGO utilisent les ID de taxon NCBI (species=9606 pour l'humain, 10090 pour la souris), UniProt utilise organism_id:9606 dans les requêtes de recherche, KEGG utilise les codes d'organisme (hsa, mmu). GTEx et Human Protein Atlas sont réservés à l'humain. Consultez le fichier de référence pour les paramètres spécifiques de chaque base de données.

Maladie et clinique

L'utilisateur demande des informations sur... Base(s) de données primaire(s) À considérer aussi
Mutations somatiques dans le cancer COSMIC Open Targets, cBioPortal
Génomique du cancer (TCGA) GDC (TCGA) COSMIC, cBioPortal
Mutations d'études tumorales, CNA, expression cBioPortal GDC (TCGA), COSMIC
Données cliniques tumorales (survie, stadification) cBioPortal GDC (TCGA)
Associations drug-target-maladie Open Targets ChEMBL
Associations gène-maladie DisGeNET Open Targets, Monarch
Relations mendeliennes maladie-gène OMIM NCBI Gene
Signification clinique du variant ClinVar (NCBI) OMIM
Associations SNP-trait GWAS GWAS Catalog
Liens maladie-phénotype-gène Monarch Initiative HPO
Ontologie de phénotype, termes HPO HPO Monarch
Pharmacogénomique, interactions drug-gène ClinPGx (PharmGKB) DrugBank
Essais cliniques pour un médicament/maladie ClinicalTrials.gov FDA
Données d'expression liées à la maladie GEO Open Targets

Brevets et réglementation

L'utilisateur demande des informations sur... Base(s) de données primaire(s) À considérer aussi
Brevets par mot-clé ou technologie USPTO (PatentsView)
Brevets par inventeur ou titulaire USPTO (PatentsView)
Statut de poursuite de brevet USPTO (PEDS)
Recherche de marque USPTO (TSDR)
Dépôts SEC d'entreprises, 10-K, 10-Q SEC EDGAR

Économie et finance

L'utilisateur demande des informations sur... Base(s) de données primaire(s) À considérer aussi
Séries chronologiques économiques US (PIB, IPC, taux) FRED BEA
Emploi, salaires, statistiques du travail BLS FRED
PIB, comptes nationaux BEA FRED, World Bank
Indicateurs de développement international World Bank FRED
Taux d'intérêt, masse monétaire Federal Reserve FRED
Taux de change en euros, statistiques monétaires BCE ECB
Dette US, courbes de rendement, données budgétaires US Treasury FRED
Prix des actions, change, crypto Alpha Vantage
Données statistiques sur de nombreux sujets Data Commons

Sciences sociales et démographie

L'utilisateur demande des informations sur... Base(s) de données primaire(s) À considérer aussi
Population US, logement, données de revenus US Census Data Commons
Statistiques UE (économie, commerce, santé) Eurostat World Bank
Indicateurs mondiaux de santé (mortalité, maladie) WHO GHO World Bank

Requêtes interdomaines

L'utilisateur demande des informations sur... Base(s) de données primaire(s) À considérer aussi
Tout sur un composé PubChem + ChEMBL + DrugBank BindingDB, ZINC, Reactome, FDA
Tout sur un gène NCBI Gene + UniProt + Ensembl Reactome, STRING, COSMIC, cBioPortal, ENA
Tout sur un variant dbSNP + ClinVar + gnomAD GWAS Catalog, COSMIC, cBioPortal
Voies de cible de médicament ChEMBL + Reactome Open Targets, GEO
Art antérieur pour une invention chimique USPTO + PubChem ChEMBL
Tout sur un matériau Materials Project + COD
Aperçu économique US FRED + BLS + BEA Federal Reserve

Lorsque la requête de l'utilisateur couvre plusieurs domaines (par ex. « que savons-nous sur l'aspirine » ou « trouvez tout sur BRCA1 »), interrogez toutes les bases de données pertinentes en parallèle.

Formats d'identificateurs courants

Les différentes bases de données utilisent différents systèmes d'identificateurs. Si une requête échoue, le format de l'identificateur peut être incorrect. Voici une référence rapide :

Identificateur Format Exemple Utilisé par
Accession UniProt P##### ou Q##### P04637 (TP53) UniProt, STRING, AlphaFold, Reactome mapping
ID gène Ensembl ENSG########### ENSG00000141510 Ensembl, Open Targets, GTEx
ID gène NCBI Entier 7157 (TP53) NCBI Gene, GEO, DisGeNET, HPO
ID HGNC HGNC:##### HGNC:11998 Monarch
CID PubChem Entier 2244 (aspirine) PubChem
ID ZINC ZINC + 15 chiffres ZINC000000000053 (aspirine) ZINC
Projet ENA PRJEB + chiffres PRJEB40665 ENA
Lecture ENA ERR + chiffres ERR1234567 ENA
Expérience ENA ERX + chiffres ERX1234567 ENA
Échantillon ENA ERS + chiffres ERS1234567 ENA
ID ChEMBL CHEMBL#### CHEMBL25 (aspirine) ChEMBL
ID stable Reactome R-HSA-###### R-HSA-109581 Reactome
Terme HP HP:####### HP:0001250 (convulsion) HPO (URL-encoder deux-points comme %3A)
Maladie MONDO MONDO:####### MONDO:0007947 Monarch
Terme GO GO:####### GO:0008150 QuickGO, Gene Ontology
rsID dbSNP rs######## rs334 dbSNP, GWAS Catalog, gnomAD
ID GENCODE ENSG###.## (versionnée) ENSG00000139618.17 GTEx (suffixe de version requis)

Résolution d'identificateurs

Lorsqu'une base de données ne reconnaît pas un identificateur, convertissez-le à l'aide de ces flux de travail :

Gènes : Symbole (par ex. « TP53 ») → recherche dans NCBI Gene (esearch par symbole) → obtenir l'ID gène NCBI → convertir en ID Ensembl via Ensembl /xrefs/symbol/homo_sapiens/{symbol}, ou en accession UniProt via UniProt recherche (gene_exact:{symbol} AND organism_id:9606).

Composés : Nom → PubChem /compound/name/{name}/cids/JSON → obtenir CID → convertir en ID ChEMBL via UniChem ou ChEMBL recherche de molécule. Si la recherche par nom échoue, essayez SMILES, InChIKey, ou numéro CAS.

Variants : rsID (par ex. « rs334 ») fonctionne directement dans dbSNP, ClinVar, GWAS Catalog, gnomAD. Pour les coordonnées génomiques, utilisez Ensembl VEP pour obtenir les annotations de conséquence et les rsID liés.

Maladies : Nom → Open Targets ou Monarch recherche → obtenir ID EFO ou MONDO → utiliser dans les requêtes en aval.

API POST uniquement

Ces bases de données nécessitent HTTP POST et ne fonctionneront pas avec WebFetch (GET uniquement). Utilisez curl via l'outil shell de votre plateforme à la place :

Base de données Raison POST requise Exemple
Open Targets Endpoint GraphQL curl -X POST -H "Content-Type: application/json" -d '{"query":"..."}' https://api.platform.opentargets.org/api/v4/graphql
gnomAD Endpoint GraphQL curl -X POST -H "Content-Type: application/json" -d '{"query":"..."}' https://gnomad.broadinstitute.org/api
RummaGEO Enrichissement POST uniquement curl -X POST -H "Content-Type: application/json" -d '{"genes":["..."]}' https://rummageo.com/api/enrich
GDC/TCGA Requêtes de filtre complexes curl -X POST -H "Content-Type: application/json" -d '{"filters":...}' https://api.gdc.cancer.gov/ssms
SEC EDGAR Nécessite en-tête User-Agent curl -H "User-Agent: VotreApp vous@email.com" https://efts.sec.gov/LATEST/search-index?q=...

Clés API et restrictions d'accès

Certaines bases de données nécessitent des clés API ou ont des restrictions d'accès. Lorsqu'une clé API est requise :

  1. Vérifiez d'abord l'environnement actuel — la clé peut déjà être exportée comme variable d'environnement shell (par ex. $FRED_API_KEY). Lisez-la directement depuis l'environnement.
  2. Revenez au .env — si la variable n'est pas dans l'environnement, consultez le fichier .env du répertoire de travail actuel.
  3. Si ni l'un ni l'autre n'en dispose — procédez sans la clé (la plupart des API fonctionnent toujours avec des limites de débit réduites) et indiquez à l'utilisateur quelle clé manque et comment l'obtenir.

Bases de données nécessitant des clés API (enregistrement gratuit)

Base de données Variable d'env URL d'enregistrement
FRED FRED_API_KEY https://fred.stlouisfed.org/docs/api/api_key.html
BEA BEA_API_KEY https://apps.bea.gov/API/signup/
BLS BLS_API_KEY https://data.bls.gov/registrationEngine/
NCBI (GEO, Gene) NCBI_API_KEY https://www.ncbi.nlm.nih.gov/account/settings/
OpenFDA OPENFDA_API_KEY https://open.fda.gov/apis/authentication/
USPTO (PatentsView) PATENTSVIEW_API_KEY https://patentsview.org/apis/keyrequest
Data Commons DATACOMMONS_API_KEY Google Cloud Console
Materials Project MP_API_KEY https://materialsproject.org (compte gratuit)
NASA NASA_API_KEY https://api.nasa.gov (gratuit, DEMO_KEY disponible)
NOAA (CDO) NOAA_API_KEY https://www.ncdc.noaa.gov/cdo-web/token
OpenWeatherMap OPENWEATHERMAP_API_KEY https://openweathermap.org/appid
OMIM OMIM_API_KEY https://omim.org/api (gratuit académique)
BioGRID BIOGRID_API_KEY https://webservice.thebiogrid.org (gratuit)
Alpha Vantage ALPHAVANTAGE_API_KEY https://www.alphavantage.co/support/#api-key
US Census CENSUS_API_KEY https://api.census.gov/data/key_signup.html
DisGeNET DISGENET_API_KEY https://www.disgenet.org (gratuit académique)
Addgene ADDGENE_API_KEY https://www.addgene.org (compte gratuit)
LINCS L1000 (CLUE) CLUE_API_KEY https://clue.io (gratuit académique)

Tous sont gratuits à obtenir. Les API fonctionnent sans clés mais avec des limites de débit réduites. Essayez toujours avec une clé d'abord — si la variable d'env n'est pas définie, procédez sans la clé et notez dans votre réponse que les limites de débit peuvent être réduites.

Bases de données avec accès payant ou restreint

Base de données Restriction Alternative gratuite
DrugBank Licence API payante requise Utilisez ChEMBL + PubChem + OpenFDA à la place
COSMIC Enregistrement académique gratuit requis (auth JWT) Utilisez Open Targets pour les données de mutations du cancer
BRENDA Enregistrement gratuit requis (SOAP, pas REST) Utilisez KEGG pour les données enzyme/voie

Lorsqu'une base de données nécessite un accès payant ou un enregistrement que l'utilisateur n'a pas configuré :

  1. Revenez à une alternative gratuite qui peut répondre à la même question
  2. Indiquez à l'utilisateur quelle base de données vous n'avez pas pu accéder, pourquoi, et ce que vous avez utilisé à la place
  3. Si l'utilisateur demande spécifiquement une base de données restreinte, expliquez les exigences d'accès pour qu'il puisse la configurer

Chargement des clés API

Étape 1 — Vérifier l'environnement actuel. La clé peut déjà être exportée comme variable shell. Par exemple, dans Claude Code, vous pouvez vérifier avec Bash : echo $FRED_API_KEY. Si la variable est définie et non vide, utilisez-la.

Étape 2 — Vérifier le fichier .env. Si la variable d'environnement n'est pas définie, lisez .env depuis le répertoire de travail actuel. Format :

FRED_API_KEY=votre_clé_ici
BEA_API_KEY=votre_clé_ici

Étape 3 — Procédez sans. Si aucune source n'a la clé, procédez sans elle (la plupart des API fonctionnent toujours avec des limites de débit réduites) et mentionnez-le à l'utilisateur.

Effectuer des appels API

Utilisez l'outil de récupération HTTP de votre environnement pour appeler les endpoints REST. Le nom de l'outil varie selon la plateforme :

Plateforme Outil de récupération HTTP Secours
Claude Code WebFetch curl via Bash
Gemini CLI web_fetch curl via shell
Windsurf read_url_content curl via terminal
Cursor Aucun outil dédié curl via run_terminal_cmd
Codex CLI Aucun outil dédié curl via shell
Cline Aucun outil dédié curl via execute_command

Si vous ne reconnaissez pas votre plateforme ou que l'outil de récupération échoue, revenez à curl via l'outil shell/terminal disponible. Exemple :

curl -s -H "Accept: application/json" "https://api.example.com/endpoint"

Directives de requête

  • Définissez l'en-tête Accept: application/json où supporté
  • URL-encodez les caractères spéciaux dans les paramètres de requête — les chaînes SMILES (/, #, =, @), les noms de composés avec parenthèses, et les termes d'ontologie avec deux-points (HP:0001250HP%3A0001250) sont des sources courantes d'échecs. Avec curl, utilisez --data-urlencode par sécurité.
  • Parallèle OK : Lors de l'interrogation de différentes bases de données (par ex., PubChem + ChEMBL + Reactome), exécutez-les en parallèle — la plupart des API ont des limites de débit généreuses.
  • Sérialisez les requêtes aux API à débit limité : NCBI APIs (Gene, GEO, Protein, Taxonomy, dbSNP, SRA) à 3 req/sec sans clé, 10 avec clé. Attention aussi à : Ensembl (15 req/sec), BLS v1 (25 req/jour sans clé), SEC EDGAR (10 req/sec), NOAA (5 req/sec avec jeton).
  • Si vous recevez une erreur de débit (HTTP 429 ou 503), attendez brièvement et réessayez une fois

Récupération d'erreurs

Si une API retourne une erreur ou des résultats vides :

  1. Vérifiez le format de l'identificateur — utilisez le tableau Common Identifier Formats ci-dessus. Un symbole de gène peut avoir besoin d'être converti en ID gène NCBI ou ID Ensembl d'abord.
  2. Essayez d'autres identificateurs — si un nom de composé échoue dans PubChem, essayez SMILES, InChIKey, ou CID. Si un symbole de gène échoue, essayez l'ID gène NCBI.
  3. Essayez une base de données différente — si une base de données est hors ligne ou retourne rien, consultez la colonne « À considérer aussi » dans le guide de sélection pour les alternatives.
  4. Signalez l'échec — indiquez à l'utilisateur quelle base de données a échoué, l'erreur, et ce que vous avez essayé à la place.

Pagination

Beaucoup d'API retournent des résultats paginés — si vous ne lisez que la première page, vous risquez de manquer des données. Modèles courants :

  • Offset/Limit : offset=0&limit=100 → incrémenter l'offset par limit pour la page suivante (ChEMBL, FRED, NOAA, USGS, NCBI E-utilities, ENA, GDC, FDA)
  • Cursor : La réponse inclut une valeur nextPageToken ou cursor — la transmettre dans la requête suivante (ClinicalTrials.gov, UniProt)
  • Numéro de page : page=1&per_page=50 → incrémenter la page (World Bank, cBioPortal, ZINC)

Consultez le fichier de référence pour les paramètres de pagination spécifiques de chaque base de données. Si une réponse inclut total, totalCount, ou next et que le nombre de résultats retournés est inférieur au total, il y a d'autres pages.

Pour les recherches ciblées (un seul gène, un seul composé), la première page suffit généralement. Paginéz lorsque l'utilisateur a besoin de résultats complets (par ex., « tous les essais cliniques pour X » ou « tous les variants connus du gène Y »).

Format de sortie

Structurez votre réponse de cette façon :

## Bases de données interrogées
- **PubChem** — /compound/name/aspirin/property/...
- **Reactome** — /search/query?query=aspirin

## Résultats

### PubChem
[réponse JSON brute]

### Reactome
[réponse JSON brute]

Si les résultats sont très volumineux, présentez la portion la plus pertinente et notez que des données supplémentaires sont disponibles. Mais par défaut, affichez le JSON brut complet — c'est ce que l'utilisateur a demandé.

Ajouter de nouvelles bases de données

Cette compétence est conçue pour évoluer. Chaque base de données est un fichier de référence autonome dans references/. Pour ajouter une nouvelle base de données :

  1. Créez references/<database-name>.md en suivant le même format que les fichiers existants
  2. Ajoutez une entrée au guide de sélection de base de données ci-dessus
  3. Le fichier de référence doit inclure : URL de base, endpoints clés, formats de paramètres de requête, appels d'exemple, limites de débit, et structure de réponse

Bases de données disponibles

Lisez le fichier de référence pertinent avant d'effectuer un appel API.

Physique et astronomie

Base de données Fichier de référence Ce qu'elle couvre
NASA references/nasa.md Astéroïdes NEO, rover Mars, APOD
NASA Exoplanet Archive references/nasa-exoplanet-archive.md Exoplanètes, paramètres orbitaux
NIST references/nist.md Constantes physiques, spectres atomiques
SDSS references/sdss.md Spectres galaxie/étoile, photométrie
SIMBAD references/simbad.md Catalogue d'objets astronomiques

Sciences de la terre et de l'environnement

Base de données Fichier de référence Ce qu'elle couvre
USGS references/usgs.md Tremblements de terre, données d'eau
NOAA references/noaa.md Climat, données de stations météo
EPA references/epa.md Qualité de l'air, rejets toxiques
OpenWeatherMap references/openweathermap.md Météo actuelle/prévisions

Chimie et médicaments

Base de données Fichier de référence Ce qu'elle couvre
PubChem references/pubchem.md Composés, propriétés, synonymes
ChEMBL references/chembl.md Bioactivité, découverte de médicaments
DrugBank references/drugbank.md Données de médicaments, interactions (payant)
FDA (OpenFDA) references/fda.md Étiquettes de médicaments, événements indésirables, rappels
DailyMed references/dailymed.md Étiquettes de médicaments (NIH/NLM)
KEGG references/kegg.md Voies, gènes, composés
ChEBI references/chebi.md Entités chimiques d'intérêt biologique
ZINC references/zinc.md Composés disponibles dans le commerce, criblage virtuel
BindingDB references/bindingdb.md Affinités de liaison mesurées expérimentalement

Science des matériaux

Base de données Fichier de référence Ce qu'elle couvre
Materials Project references/materials-project.md Bandes interdites, propriétés élastiques, structures cristallines
COD references/cod.md Structures cristallines, fichiers CIF

Biologie et génomique

Base de données Fichier de référence Ce qu'elle couvre
Reactome references/reactome.md Voies biologiques, réactions
BRENDA references/brenda.md Cinétique enzymatique, catalyse (SOAP)
UniProt references/uniprot.md Séquences protéiques, fonction
STRING references/string.md Interactions protéine-protéine
Ensembl references/ensembl.md Génomes, variants, séquences
NCBI Gene references/ncbi-gene.md Information génique, liens
NCBI Protein references/ncbi-protein.md Séquences protéiques, enregistrements
NCBI Taxonomy references/ncbi-taxonomy.md Classification taxonomique
GEO (NCBI) references/geo.md Ensembles de données d'expression génique
GTEx references/gtex.md Expression génique entre tissus
PDB references/pdb.md Structures protéiques 3D
AlphaFold DB references/alphafold.md Structures protéiques prédites
EMDB references/emdb.md Cartes de microscopie électronique
InterPro references/interpro.md Familles protéiques, domaines
BioGRID references/biogrid.md Interactions protéine/génétiques
Gene Ontology references/gene-ontology.md Termes GO, annotations géniques
QuickGO references/quickgo.md Annotations GO (EBI, recommandé)
dbSNP references/dbsnp.md Données SNP/variant
SRA references/sra.md Métadonnées de lecture de séquençage
gnomAD references/gnomad.md Fréquences de variants dans la population (POST)
UCSC Genome Browser references/ucsc-genome.md Annotations de génome, pistes
ENCODE references/encode.md Éléments ADN, ChIP-seq, ATAC-seq
JASPAR references/jaspar.md Profils/motifs de liaison TF
Human Protein Atlas references/human-protein-atlas.md Expression protéique entre tissus
Human Cell Atlas references/hca.md Données d'atlas unicellulaires
LINCS L1000 references/lincs-l1000.md Signatures d'expression génique (CMap)
RummaGEO references/rummageo.md Enrichissement d'ensemble de gènes GEO (POST)
PRIDE references/pride.md Répertoire de données de protéomique
Metabolomics Workbench references/metabolomics-workbench.md Études de métabolomique, métabolites
MouseMine references/mousemine.md Informatique de génome de souris
ENA references/ena.md Séquences nucléotidiques, lectures, assemblages, taxonomie (EMBL-EBI)
Addgene references/addgene.md Répertoire de plasmides

Maladie et clinique

Base de données Fichier de référence Ce qu'elle couvre
Open Targets references/opentargets.md Associations cible-maladie (POST)
COSMIC references/cosmic.md Mutations somatiques dans le cancer
ClinPGx (PharmGKB) references/clinpgx.md Pharmacogénomique
ClinicalTrials.gov references/clinicaltrials.md Registre d'essai clinique
OMIM references/omim.md Données mendeliennes maladie-gène
ClinVar references/clinvar.md Signification clinique du variant
GDC (TCGA) references/tcga-gdc.md Génomique du cancer, mutations (POST)
cBioPortal references/cbioportal.md Mutations d'études tumorales, CNA, expression, données cliniques
DisGeNET references/disgenet.md Associations gène-maladie
GWAS Catalog references/gwas-catalog.md Associations SNP-trait GWAS
Monarch Initiative references/monarch.md Liens maladie-phénotype-gène
HPO references/hpo.md Ontologie de phénotype humain

Brevets et réglementation

Base de données Fichier de référence Ce qu'elle couvre
USPTO references/uspto.md Brevets, marques
SEC EDGAR references/sec-edgar.md Dépôts d'entreprises (nécessite en-tête User-Agent)

Économie et finance

Base de données Fichier de référence Ce qu'elle couvre
FRED references/fred.md Séries chronologiques économiques US
Federal Reserve references/federal-reserve.md Données monétaires/financières
BEA references/bea.md PIB, comptes nationaux
BLS references/bls.md Emploi, salaires, IPC
World Bank references/worldbank.md Indicateurs de développement
ECB references/ecb.md Taux de change en euros, statistiques monétaires
US Treasury references/treasury.md Dette, courbes de rendement, données budgétaires
Alpha Vantage references/alphavantage.md Actions, change, crypto
Data Commons references/datacommons.md Graphe de connaissance statistique

Sciences sociales et démographie

Base de données Fichier de référence Ce qu'elle couvre
US Census references/census.md Population, logement, enquêtes économiques
Eurostat references/eurostat.md Statistiques UE
WHO GHO references/who.md Indicateurs mondiaux de santé

Skills similaires