name: database-lookup description: Recherchez dans 78 bases de données scientifiques, biomédicales, des matériaux et économiques publiques via leurs API REST et retournez des résultats JSON structurés. Couvre physique/astronomie (NASA, NIST, SDSS, SIMBAD, Exoplanet Archive), terre/environnement (USGS, NOAA, EPA, OpenWeatherMap), chimie/médicaments (PubChem, ChEMBL, DrugBank, FDA, KEGG, DailyMed, ZINC, BindingDB), science des matériaux (Materials Project, COD), biologie/génomique (Reactome, BRENDA, UniProt, STRING, Ensembl, NCBI Gene, GEO, GTEx, PDB, AlphaFold, InterPro, ChEBI, BioGRID, Gene Ontology, QuickGO, NCBI Protein/Taxonomy, dbSNP, SRA, ENA, gnomAD, UCSC Genome, ENCODE, JASPAR, MouseMine, PRIDE, LINCS L1000, Human Protein Atlas, Human Cell Atlas, RummaGEO, Metabolomics Workbench, EMDB, Addgene), maladie/clinique (COSMIC, Open Targets, ClinPGx, ClinicalTrials.gov, OMIM, ClinVar, GDC/TCGA, cBioPortal, DisGeNET, GWAS Catalog, Monarch, HPO), réglementaire (FDA, USPTO, SEC EDGAR), économie/finance (FRED, BEA, BLS, Federal Reserve, World Bank, BCE, Trésor US, Alpha Vantage, Data Commons), et démographie (Recensement US, Eurostat, OMS). Utilisez cette compétence chaque fois que l'utilisateur souhaite rechercher des composés, médicaments, protéines, gènes, voies, enzymes, expression génique, variants, essais cliniques, brevets, dépôts SEC, indicateurs économiques, structures cristallines, objets astronomiques, tremblements de terre, météo, ou toute donnée issue d'une API de base de données publique. Déclenchez aussi lorsque l'utilisateur mentionne une base de données par son nom ou pose des questions sur les propriétés moléculaires, interactions drug-target, affinités de liaison, interactions protéiques, appartenance aux voies, pharmacogénomique, séries chronologiques économiques, propriétés des matériaux, composés disponibles dans le commerce, criblage virtuel, accessibilité des composés, bibliothèques chimiques, blocs de construction, génomique du cancer, mutations somatiques, profils de mutations tumorales, séquences nucléotidiques, assemblages de génomes, lectures de séquençage, accessions ENA, données INSDC, ou souhaite effectuer un recoupement d'entités entre sources. tags: [scientific-skills, database-lookup, api, cheminformatics, clinical, finance, react, database, bioinformatics, search, compliance] metadata: skill-author: K-Dense Inc. ---|---| | Objets géocroiseurs, astéroïdes | NASA (NeoWs) | — | | Images du rover Mars | NASA (Mars Rover Photos) | — | | Exoplanètes, paramètres orbitaux | NASA Exoplanet Archive | — | | Objets astronomiques par nom/coordonnées | SIMBAD | SDSS | | Spectres/photométrie de galaxies/étoiles | SDSS | SIMBAD | | Constantes physiques | NIST | — | | Spectres atomiques, raies spectrales | NIST (ASD) | — |
Sciences de la terre et de l'environnement
| L'utilisateur demande des informations sur... | Base(s) de données primaire(s) | À considérer aussi |
|---|---|---|
| Tremblements de terre, événements sismiques | USGS Earthquakes | — |
| Données sur l'eau, débits fluviaux, eaux souterraines | USGS Water Services | — |
| Météo (actuelle, prévisions, historique) | OpenWeatherMap | NOAA |
| Données climatiques, stations météo historiques | NOAA (CDO) | — |
| Qualité de l'air, rejets toxiques | EPA (Envirofacts) | — |
Chimie et médicaments
| L'utilisateur demande des informations sur... | Base(s) de données primaire(s) | À considérer aussi |
|---|---|---|
| Composés chimiques, molécules | PubChem | ChEMBL |
| Propriétés moléculaires (poids, formule, SMILES) | PubChem | — |
| Synonymes de médicaments, numéros CAS | PubChem (synonymes) | DrugBank |
| Données de bioactivité, IC50, essais de liaison | ChEMBL | BindingDB, PubChem |
| Affinités de liaison des médicaments (Ki, IC50, Kd) | ChEMBL, BindingDB | PubChem |
| Interactions drug-target | ChEMBL, DrugBank | BindingDB, Open Targets |
| Ligands pour une cible protéique (par UniProt) | BindingDB | ChEMBL |
| Identification de cible à partir de la structure du composé | BindingDB (similarité SMILES) | ChEMBL |
| Étiquettes de médicaments, événements indésirables, rappels | FDA (OpenFDA) | DailyMed |
| Étiquettes de médicaments (étiquettes de produits structurées) | DailyMed | FDA (OpenFDA) |
| Pharmacologie, indications des médicaments | DrugBank | FDA |
| Recoupement chimique | PubChem (xrefs) | ChEMBL |
| Composés disponibles dans le commerce pour le criblage | ZINC | PubChem |
| Recherche de similarité/sous-structure (achetable) | ZINC | PubChem, ChEMBL |
| Bibliothèques de composés drug-like, blocs de construction | ZINC | — |
| Structures de médicaments approuvés par la FDA | ZINC (fda subset) | PubChem, FDA |
| Accessibilité des composés, catalogues de vendeurs | ZINC | — |
Science des matériaux et cristallographie
| L'utilisateur demande des informations sur... | Base(s) de données primaire(s) | À considérer aussi |
|---|---|---|
| Matériaux par formule ou éléments | Materials Project | COD |
| Bande interdite, structure électronique | Materials Project | — |
| Structures cristallines, fichiers CIF | COD | Materials Project |
| Propriétés élastiques/mécaniques | Materials Project | — |
| Énergie de formation, thermodynamique | Materials Project | — |
| Paramètres de maille, groupes d'espace | COD | Materials Project |
Biologie et génomique
| L'utilisateur demande des informations sur... | Base(s) de données primaire(s) | À considérer aussi |
|---|---|---|
| Voies biologiques | Reactome, KEGG | — |
| Voies auxquelles appartient un gène/protéine | Reactome (mapping), KEGG | — |
| Cinétique enzymatique, activité catalytique | BRENDA | KEGG |
| Études de métabolomique, profils de métabolites | Metabolomics Workbench | PubChem |
| Recherche m/z ou masse exacte | Metabolomics Workbench (moverz/exactmass) | PubChem |
| Séquence protéique, fonction, annotation | UniProt | Ensembl |
| Interactions protéine-protéine | STRING | BioGRID |
| Information génique, localisation génomique | NCBI Gene | Ensembl |
| Séquences de génome, variants, transcrits | Ensembl | NCBI Gene |
| Ensembles de données d'expression génique | GEO (NCBI E-utilities) | — |
| Expression génique entre tissus | GTEx | Human Protein Atlas |
| Signatures d'expression génique (CMap/L1000) | LINCS L1000 | GEO |
| Enrichissement d'ensembles de gènes vs GEO | RummaGEO | GEO |
| Séquences protéiques (NCBI) | NCBI Protein | UniProt |
| Classification taxonomique | NCBI Taxonomy | — |
| Données SNP/variant (dbSNP) | dbSNP | ClinVar, gnomAD |
| Fréquences de variants dans la population | gnomAD | dbSNP |
| Métadonnées de lecture de séquençage | SRA | ENA, GEO |
| Séquences nucléotidiques (archive européenne) | ENA | SRA, NCBI Gene |
| Assemblages de génomes, lectures brutes (européenne) | ENA | SRA, Ensembl |
| Recoupements à partir d'accessions de séquences | ENA (xref) | NCBI Gene, UniProt |
| Annotations de génome, pistes | UCSC Genome Browser | Ensembl |
| Structures protéiques 3D (expérimentales) | PDB (RCSB) | EMDB |
| Structures protéiques 3D (prédites) | AlphaFold DB | PDB |
| Cartes EM, structures cryo-EM | EMDB | PDB |
| Familles protéiques, domaines | InterPro | UniProt |
| Entités chimiques (biologiques) | ChEBI | PubChem |
| Interactions protéine/génétiques | BioGRID | STRING |
| Annotations de fonction génique (termes GO) | QuickGO | Gene Ontology |
| Éléments régulateurs, ChIP-seq, ATAC-seq | ENCODE | — |
| Profils/motifs de liaison TF | JASPAR | ENCODE |
| Expression protéique entre tissus | Human Protein Atlas | UniProt |
| Projets d'atlas unicellulaires | Human Cell Atlas | — |
| Ensembles de données de protéomique | PRIDE | — |
| Données géniques souris | MouseMine | NCBI Gene |
| Répertoire de plasmides | Addgene | — |
L'organisme/espèce compte. La plupart des bases de données biologiques couvrent plusieurs organismes. Si la requête de l'utilisateur concerne un organisme spécifique, transmettez-la explicitement — ne supposez pas l'humain. Modèles courants : Ensembl utilise {species} dans le chemin URL (par ex. homo_sapiens), STRING/BioGRID/QuickGO utilisent les ID de taxon NCBI (species=9606 pour l'humain, 10090 pour la souris), UniProt utilise organism_id:9606 dans les requêtes de recherche, KEGG utilise les codes d'organisme (hsa, mmu). GTEx et Human Protein Atlas sont réservés à l'humain. Consultez le fichier de référence pour les paramètres spécifiques de chaque base de données.
Maladie et clinique
| L'utilisateur demande des informations sur... | Base(s) de données primaire(s) | À considérer aussi |
|---|---|---|
| Mutations somatiques dans le cancer | COSMIC | Open Targets, cBioPortal |
| Génomique du cancer (TCGA) | GDC (TCGA) | COSMIC, cBioPortal |
| Mutations d'études tumorales, CNA, expression | cBioPortal | GDC (TCGA), COSMIC |
| Données cliniques tumorales (survie, stadification) | cBioPortal | GDC (TCGA) |
| Associations drug-target-maladie | Open Targets | ChEMBL |
| Associations gène-maladie | DisGeNET | Open Targets, Monarch |
| Relations mendeliennes maladie-gène | OMIM | NCBI Gene |
| Signification clinique du variant | ClinVar (NCBI) | OMIM |
| Associations SNP-trait GWAS | GWAS Catalog | — |
| Liens maladie-phénotype-gène | Monarch Initiative | HPO |
| Ontologie de phénotype, termes HPO | HPO | Monarch |
| Pharmacogénomique, interactions drug-gène | ClinPGx (PharmGKB) | DrugBank |
| Essais cliniques pour un médicament/maladie | ClinicalTrials.gov | FDA |
| Données d'expression liées à la maladie | GEO | Open Targets |
Brevets et réglementation
| L'utilisateur demande des informations sur... | Base(s) de données primaire(s) | À considérer aussi |
|---|---|---|
| Brevets par mot-clé ou technologie | USPTO (PatentsView) | — |
| Brevets par inventeur ou titulaire | USPTO (PatentsView) | — |
| Statut de poursuite de brevet | USPTO (PEDS) | — |
| Recherche de marque | USPTO (TSDR) | — |
| Dépôts SEC d'entreprises, 10-K, 10-Q | SEC EDGAR | — |
Économie et finance
| L'utilisateur demande des informations sur... | Base(s) de données primaire(s) | À considérer aussi |
|---|---|---|
| Séries chronologiques économiques US (PIB, IPC, taux) | FRED | BEA |
| Emploi, salaires, statistiques du travail | BLS | FRED |
| PIB, comptes nationaux | BEA | FRED, World Bank |
| Indicateurs de développement international | World Bank | FRED |
| Taux d'intérêt, masse monétaire | Federal Reserve | FRED |
| Taux de change en euros, statistiques monétaires BCE | ECB | — |
| Dette US, courbes de rendement, données budgétaires | US Treasury | FRED |
| Prix des actions, change, crypto | Alpha Vantage | — |
| Données statistiques sur de nombreux sujets | Data Commons | — |
Sciences sociales et démographie
| L'utilisateur demande des informations sur... | Base(s) de données primaire(s) | À considérer aussi |
|---|---|---|
| Population US, logement, données de revenus | US Census | Data Commons |
| Statistiques UE (économie, commerce, santé) | Eurostat | World Bank |
| Indicateurs mondiaux de santé (mortalité, maladie) | WHO GHO | World Bank |
Requêtes interdomaines
| L'utilisateur demande des informations sur... | Base(s) de données primaire(s) | À considérer aussi |
|---|---|---|
| Tout sur un composé | PubChem + ChEMBL + DrugBank | BindingDB, ZINC, Reactome, FDA |
| Tout sur un gène | NCBI Gene + UniProt + Ensembl | Reactome, STRING, COSMIC, cBioPortal, ENA |
| Tout sur un variant | dbSNP + ClinVar + gnomAD | GWAS Catalog, COSMIC, cBioPortal |
| Voies de cible de médicament | ChEMBL + Reactome | Open Targets, GEO |
| Art antérieur pour une invention chimique | USPTO + PubChem | ChEMBL |
| Tout sur un matériau | Materials Project + COD | — |
| Aperçu économique US | FRED + BLS + BEA | Federal Reserve |
Lorsque la requête de l'utilisateur couvre plusieurs domaines (par ex. « que savons-nous sur l'aspirine » ou « trouvez tout sur BRCA1 »), interrogez toutes les bases de données pertinentes en parallèle.
Formats d'identificateurs courants
Les différentes bases de données utilisent différents systèmes d'identificateurs. Si une requête échoue, le format de l'identificateur peut être incorrect. Voici une référence rapide :
| Identificateur | Format | Exemple | Utilisé par |
|---|---|---|---|
| Accession UniProt | P##### ou Q##### |
P04637 (TP53) |
UniProt, STRING, AlphaFold, Reactome mapping |
| ID gène Ensembl | ENSG########### |
ENSG00000141510 |
Ensembl, Open Targets, GTEx |
| ID gène NCBI | Entier | 7157 (TP53) |
NCBI Gene, GEO, DisGeNET, HPO |
| ID HGNC | HGNC:##### |
HGNC:11998 |
Monarch |
| CID PubChem | Entier | 2244 (aspirine) |
PubChem |
| ID ZINC | ZINC + 15 chiffres |
ZINC000000000053 (aspirine) |
ZINC |
| Projet ENA | PRJEB + chiffres |
PRJEB40665 |
ENA |
| Lecture ENA | ERR + chiffres |
ERR1234567 |
ENA |
| Expérience ENA | ERX + chiffres |
ERX1234567 |
ENA |
| Échantillon ENA | ERS + chiffres |
ERS1234567 |
ENA |
| ID ChEMBL | CHEMBL#### |
CHEMBL25 (aspirine) |
ChEMBL |
| ID stable Reactome | R-HSA-###### |
R-HSA-109581 |
Reactome |
| Terme HP | HP:####### |
HP:0001250 (convulsion) |
HPO (URL-encoder deux-points comme %3A) |
| Maladie MONDO | MONDO:####### |
MONDO:0007947 |
Monarch |
| Terme GO | GO:####### |
GO:0008150 |
QuickGO, Gene Ontology |
| rsID dbSNP | rs######## |
rs334 |
dbSNP, GWAS Catalog, gnomAD |
| ID GENCODE | ENSG###.## (versionnée) |
ENSG00000139618.17 |
GTEx (suffixe de version requis) |
Résolution d'identificateurs
Lorsqu'une base de données ne reconnaît pas un identificateur, convertissez-le à l'aide de ces flux de travail :
Gènes : Symbole (par ex. « TP53 ») → recherche dans NCBI Gene (esearch par symbole) → obtenir l'ID gène NCBI → convertir en ID Ensembl via Ensembl /xrefs/symbol/homo_sapiens/{symbol}, ou en accession UniProt via UniProt recherche (gene_exact:{symbol} AND organism_id:9606).
Composés : Nom → PubChem /compound/name/{name}/cids/JSON → obtenir CID → convertir en ID ChEMBL via UniChem ou ChEMBL recherche de molécule. Si la recherche par nom échoue, essayez SMILES, InChIKey, ou numéro CAS.
Variants : rsID (par ex. « rs334 ») fonctionne directement dans dbSNP, ClinVar, GWAS Catalog, gnomAD. Pour les coordonnées génomiques, utilisez Ensembl VEP pour obtenir les annotations de conséquence et les rsID liés.
Maladies : Nom → Open Targets ou Monarch recherche → obtenir ID EFO ou MONDO → utiliser dans les requêtes en aval.
API POST uniquement
Ces bases de données nécessitent HTTP POST et ne fonctionneront pas avec WebFetch (GET uniquement). Utilisez curl via l'outil shell de votre plateforme à la place :
| Base de données | Raison POST requise | Exemple |
|---|---|---|
| Open Targets | Endpoint GraphQL | curl -X POST -H "Content-Type: application/json" -d '{"query":"..."}' https://api.platform.opentargets.org/api/v4/graphql |
| gnomAD | Endpoint GraphQL | curl -X POST -H "Content-Type: application/json" -d '{"query":"..."}' https://gnomad.broadinstitute.org/api |
| RummaGEO | Enrichissement POST uniquement | curl -X POST -H "Content-Type: application/json" -d '{"genes":["..."]}' https://rummageo.com/api/enrich |
| GDC/TCGA | Requêtes de filtre complexes | curl -X POST -H "Content-Type: application/json" -d '{"filters":...}' https://api.gdc.cancer.gov/ssms |
| SEC EDGAR | Nécessite en-tête User-Agent | curl -H "User-Agent: VotreApp vous@email.com" https://efts.sec.gov/LATEST/search-index?q=... |
Clés API et restrictions d'accès
Certaines bases de données nécessitent des clés API ou ont des restrictions d'accès. Lorsqu'une clé API est requise :
- Vérifiez d'abord l'environnement actuel — la clé peut déjà être exportée comme variable d'environnement shell (par ex.
$FRED_API_KEY). Lisez-la directement depuis l'environnement. - Revenez au
.env— si la variable n'est pas dans l'environnement, consultez le fichier.envdu répertoire de travail actuel. - Si ni l'un ni l'autre n'en dispose — procédez sans la clé (la plupart des API fonctionnent toujours avec des limites de débit réduites) et indiquez à l'utilisateur quelle clé manque et comment l'obtenir.
Bases de données nécessitant des clés API (enregistrement gratuit)
| Base de données | Variable d'env | URL d'enregistrement |
|---|---|---|
| FRED | FRED_API_KEY |
https://fred.stlouisfed.org/docs/api/api_key.html |
| BEA | BEA_API_KEY |
https://apps.bea.gov/API/signup/ |
| BLS | BLS_API_KEY |
https://data.bls.gov/registrationEngine/ |
| NCBI (GEO, Gene) | NCBI_API_KEY |
https://www.ncbi.nlm.nih.gov/account/settings/ |
| OpenFDA | OPENFDA_API_KEY |
https://open.fda.gov/apis/authentication/ |
| USPTO (PatentsView) | PATENTSVIEW_API_KEY |
https://patentsview.org/apis/keyrequest |
| Data Commons | DATACOMMONS_API_KEY |
Google Cloud Console |
| Materials Project | MP_API_KEY |
https://materialsproject.org (compte gratuit) |
| NASA | NASA_API_KEY |
https://api.nasa.gov (gratuit, DEMO_KEY disponible) |
| NOAA (CDO) | NOAA_API_KEY |
https://www.ncdc.noaa.gov/cdo-web/token |
| OpenWeatherMap | OPENWEATHERMAP_API_KEY |
https://openweathermap.org/appid |
| OMIM | OMIM_API_KEY |
https://omim.org/api (gratuit académique) |
| BioGRID | BIOGRID_API_KEY |
https://webservice.thebiogrid.org (gratuit) |
| Alpha Vantage | ALPHAVANTAGE_API_KEY |
https://www.alphavantage.co/support/#api-key |
| US Census | CENSUS_API_KEY |
https://api.census.gov/data/key_signup.html |
| DisGeNET | DISGENET_API_KEY |
https://www.disgenet.org (gratuit académique) |
| Addgene | ADDGENE_API_KEY |
https://www.addgene.org (compte gratuit) |
| LINCS L1000 (CLUE) | CLUE_API_KEY |
https://clue.io (gratuit académique) |
Tous sont gratuits à obtenir. Les API fonctionnent sans clés mais avec des limites de débit réduites. Essayez toujours avec une clé d'abord — si la variable d'env n'est pas définie, procédez sans la clé et notez dans votre réponse que les limites de débit peuvent être réduites.
Bases de données avec accès payant ou restreint
| Base de données | Restriction | Alternative gratuite |
|---|---|---|
| DrugBank | Licence API payante requise | Utilisez ChEMBL + PubChem + OpenFDA à la place |
| COSMIC | Enregistrement académique gratuit requis (auth JWT) | Utilisez Open Targets pour les données de mutations du cancer |
| BRENDA | Enregistrement gratuit requis (SOAP, pas REST) | Utilisez KEGG pour les données enzyme/voie |
Lorsqu'une base de données nécessite un accès payant ou un enregistrement que l'utilisateur n'a pas configuré :
- Revenez à une alternative gratuite qui peut répondre à la même question
- Indiquez à l'utilisateur quelle base de données vous n'avez pas pu accéder, pourquoi, et ce que vous avez utilisé à la place
- Si l'utilisateur demande spécifiquement une base de données restreinte, expliquez les exigences d'accès pour qu'il puisse la configurer
Chargement des clés API
Étape 1 — Vérifier l'environnement actuel. La clé peut déjà être exportée comme variable shell. Par exemple, dans Claude Code, vous pouvez vérifier avec Bash : echo $FRED_API_KEY. Si la variable est définie et non vide, utilisez-la.
Étape 2 — Vérifier le fichier .env. Si la variable d'environnement n'est pas définie, lisez .env depuis le répertoire de travail actuel. Format :
FRED_API_KEY=votre_clé_ici
BEA_API_KEY=votre_clé_ici
Étape 3 — Procédez sans. Si aucune source n'a la clé, procédez sans elle (la plupart des API fonctionnent toujours avec des limites de débit réduites) et mentionnez-le à l'utilisateur.
Effectuer des appels API
Utilisez l'outil de récupération HTTP de votre environnement pour appeler les endpoints REST. Le nom de l'outil varie selon la plateforme :
| Plateforme | Outil de récupération HTTP | Secours |
|---|---|---|
| Claude Code | WebFetch |
curl via Bash |
| Gemini CLI | web_fetch |
curl via shell |
| Windsurf | read_url_content |
curl via terminal |
| Cursor | Aucun outil dédié | curl via run_terminal_cmd |
| Codex CLI | Aucun outil dédié | curl via shell |
| Cline | Aucun outil dédié | curl via execute_command |
Si vous ne reconnaissez pas votre plateforme ou que l'outil de récupération échoue, revenez à curl via l'outil shell/terminal disponible. Exemple :
curl -s -H "Accept: application/json" "https://api.example.com/endpoint"
Directives de requête
- Définissez l'en-tête
Accept: application/jsonoù supporté - URL-encodez les caractères spéciaux dans les paramètres de requête — les chaînes SMILES (
/,#,=,@), les noms de composés avec parenthèses, et les termes d'ontologie avec deux-points (HP:0001250→HP%3A0001250) sont des sources courantes d'échecs. Aveccurl, utilisez--data-urlencodepar sécurité. - Parallèle OK : Lors de l'interrogation de différentes bases de données (par ex., PubChem + ChEMBL + Reactome), exécutez-les en parallèle — la plupart des API ont des limites de débit généreuses.
- Sérialisez les requêtes aux API à débit limité : NCBI APIs (Gene, GEO, Protein, Taxonomy, dbSNP, SRA) à 3 req/sec sans clé, 10 avec clé. Attention aussi à : Ensembl (15 req/sec), BLS v1 (25 req/jour sans clé), SEC EDGAR (10 req/sec), NOAA (5 req/sec avec jeton).
- Si vous recevez une erreur de débit (HTTP 429 ou 503), attendez brièvement et réessayez une fois
Récupération d'erreurs
Si une API retourne une erreur ou des résultats vides :
- Vérifiez le format de l'identificateur — utilisez le tableau Common Identifier Formats ci-dessus. Un symbole de gène peut avoir besoin d'être converti en ID gène NCBI ou ID Ensembl d'abord.
- Essayez d'autres identificateurs — si un nom de composé échoue dans PubChem, essayez SMILES, InChIKey, ou CID. Si un symbole de gène échoue, essayez l'ID gène NCBI.
- Essayez une base de données différente — si une base de données est hors ligne ou retourne rien, consultez la colonne « À considérer aussi » dans le guide de sélection pour les alternatives.
- Signalez l'échec — indiquez à l'utilisateur quelle base de données a échoué, l'erreur, et ce que vous avez essayé à la place.
Pagination
Beaucoup d'API retournent des résultats paginés — si vous ne lisez que la première page, vous risquez de manquer des données. Modèles courants :
- Offset/Limit :
offset=0&limit=100→ incrémenter l'offset par limit pour la page suivante (ChEMBL, FRED, NOAA, USGS, NCBI E-utilities, ENA, GDC, FDA) - Cursor : La réponse inclut une valeur
nextPageTokenoucursor— la transmettre dans la requête suivante (ClinicalTrials.gov, UniProt) - Numéro de page :
page=1&per_page=50→ incrémenter la page (World Bank, cBioPortal, ZINC)
Consultez le fichier de référence pour les paramètres de pagination spécifiques de chaque base de données. Si une réponse inclut total, totalCount, ou next et que le nombre de résultats retournés est inférieur au total, il y a d'autres pages.
Pour les recherches ciblées (un seul gène, un seul composé), la première page suffit généralement. Paginéz lorsque l'utilisateur a besoin de résultats complets (par ex., « tous les essais cliniques pour X » ou « tous les variants connus du gène Y »).
Format de sortie
Structurez votre réponse de cette façon :
## Bases de données interrogées
- **PubChem** — /compound/name/aspirin/property/...
- **Reactome** — /search/query?query=aspirin
## Résultats
### PubChem
[réponse JSON brute]
### Reactome
[réponse JSON brute]
Si les résultats sont très volumineux, présentez la portion la plus pertinente et notez que des données supplémentaires sont disponibles. Mais par défaut, affichez le JSON brut complet — c'est ce que l'utilisateur a demandé.
Ajouter de nouvelles bases de données
Cette compétence est conçue pour évoluer. Chaque base de données est un fichier de référence autonome dans references/. Pour ajouter une nouvelle base de données :
- Créez
references/<database-name>.mden suivant le même format que les fichiers existants - Ajoutez une entrée au guide de sélection de base de données ci-dessus
- Le fichier de référence doit inclure : URL de base, endpoints clés, formats de paramètres de requête, appels d'exemple, limites de débit, et structure de réponse
Bases de données disponibles
Lisez le fichier de référence pertinent avant d'effectuer un appel API.
Physique et astronomie
| Base de données | Fichier de référence | Ce qu'elle couvre |
|---|---|---|
| NASA | references/nasa.md |
Astéroïdes NEO, rover Mars, APOD |
| NASA Exoplanet Archive | references/nasa-exoplanet-archive.md |
Exoplanètes, paramètres orbitaux |
| NIST | references/nist.md |
Constantes physiques, spectres atomiques |
| SDSS | references/sdss.md |
Spectres galaxie/étoile, photométrie |
| SIMBAD | references/simbad.md |
Catalogue d'objets astronomiques |
Sciences de la terre et de l'environnement
| Base de données | Fichier de référence | Ce qu'elle couvre |
|---|---|---|
| USGS | references/usgs.md |
Tremblements de terre, données d'eau |
| NOAA | references/noaa.md |
Climat, données de stations météo |
| EPA | references/epa.md |
Qualité de l'air, rejets toxiques |
| OpenWeatherMap | references/openweathermap.md |
Météo actuelle/prévisions |
Chimie et médicaments
| Base de données | Fichier de référence | Ce qu'elle couvre |
|---|---|---|
| PubChem | references/pubchem.md |
Composés, propriétés, synonymes |
| ChEMBL | references/chembl.md |
Bioactivité, découverte de médicaments |
| DrugBank | references/drugbank.md |
Données de médicaments, interactions (payant) |
| FDA (OpenFDA) | references/fda.md |
Étiquettes de médicaments, événements indésirables, rappels |
| DailyMed | references/dailymed.md |
Étiquettes de médicaments (NIH/NLM) |
| KEGG | references/kegg.md |
Voies, gènes, composés |
| ChEBI | references/chebi.md |
Entités chimiques d'intérêt biologique |
| ZINC | references/zinc.md |
Composés disponibles dans le commerce, criblage virtuel |
| BindingDB | references/bindingdb.md |
Affinités de liaison mesurées expérimentalement |
Science des matériaux
| Base de données | Fichier de référence | Ce qu'elle couvre |
|---|---|---|
| Materials Project | references/materials-project.md |
Bandes interdites, propriétés élastiques, structures cristallines |
| COD | references/cod.md |
Structures cristallines, fichiers CIF |
Biologie et génomique
| Base de données | Fichier de référence | Ce qu'elle couvre |
|---|---|---|
| Reactome | references/reactome.md |
Voies biologiques, réactions |
| BRENDA | references/brenda.md |
Cinétique enzymatique, catalyse (SOAP) |
| UniProt | references/uniprot.md |
Séquences protéiques, fonction |
| STRING | references/string.md |
Interactions protéine-protéine |
| Ensembl | references/ensembl.md |
Génomes, variants, séquences |
| NCBI Gene | references/ncbi-gene.md |
Information génique, liens |
| NCBI Protein | references/ncbi-protein.md |
Séquences protéiques, enregistrements |
| NCBI Taxonomy | references/ncbi-taxonomy.md |
Classification taxonomique |
| GEO (NCBI) | references/geo.md |
Ensembles de données d'expression génique |
| GTEx | references/gtex.md |
Expression génique entre tissus |
| PDB | references/pdb.md |
Structures protéiques 3D |
| AlphaFold DB | references/alphafold.md |
Structures protéiques prédites |
| EMDB | references/emdb.md |
Cartes de microscopie électronique |
| InterPro | references/interpro.md |
Familles protéiques, domaines |
| BioGRID | references/biogrid.md |
Interactions protéine/génétiques |
| Gene Ontology | references/gene-ontology.md |
Termes GO, annotations géniques |
| QuickGO | references/quickgo.md |
Annotations GO (EBI, recommandé) |
| dbSNP | references/dbsnp.md |
Données SNP/variant |
| SRA | references/sra.md |
Métadonnées de lecture de séquençage |
| gnomAD | references/gnomad.md |
Fréquences de variants dans la population (POST) |
| UCSC Genome Browser | references/ucsc-genome.md |
Annotations de génome, pistes |
| ENCODE | references/encode.md |
Éléments ADN, ChIP-seq, ATAC-seq |
| JASPAR | references/jaspar.md |
Profils/motifs de liaison TF |
| Human Protein Atlas | references/human-protein-atlas.md |
Expression protéique entre tissus |
| Human Cell Atlas | references/hca.md |
Données d'atlas unicellulaires |
| LINCS L1000 | references/lincs-l1000.md |
Signatures d'expression génique (CMap) |
| RummaGEO | references/rummageo.md |
Enrichissement d'ensemble de gènes GEO (POST) |
| PRIDE | references/pride.md |
Répertoire de données de protéomique |
| Metabolomics Workbench | references/metabolomics-workbench.md |
Études de métabolomique, métabolites |
| MouseMine | references/mousemine.md |
Informatique de génome de souris |
| ENA | references/ena.md |
Séquences nucléotidiques, lectures, assemblages, taxonomie (EMBL-EBI) |
| Addgene | references/addgene.md |
Répertoire de plasmides |
Maladie et clinique
| Base de données | Fichier de référence | Ce qu'elle couvre |
|---|---|---|
| Open Targets | references/opentargets.md |
Associations cible-maladie (POST) |
| COSMIC | references/cosmic.md |
Mutations somatiques dans le cancer |
| ClinPGx (PharmGKB) | references/clinpgx.md |
Pharmacogénomique |
| ClinicalTrials.gov | references/clinicaltrials.md |
Registre d'essai clinique |
| OMIM | references/omim.md |
Données mendeliennes maladie-gène |
| ClinVar | references/clinvar.md |
Signification clinique du variant |
| GDC (TCGA) | references/tcga-gdc.md |
Génomique du cancer, mutations (POST) |
| cBioPortal | references/cbioportal.md |
Mutations d'études tumorales, CNA, expression, données cliniques |
| DisGeNET | references/disgenet.md |
Associations gène-maladie |
| GWAS Catalog | references/gwas-catalog.md |
Associations SNP-trait GWAS |
| Monarch Initiative | references/monarch.md |
Liens maladie-phénotype-gène |
| HPO | references/hpo.md |
Ontologie de phénotype humain |
Brevets et réglementation
| Base de données | Fichier de référence | Ce qu'elle couvre |
|---|---|---|
| USPTO | references/uspto.md |
Brevets, marques |
| SEC EDGAR | references/sec-edgar.md |
Dépôts d'entreprises (nécessite en-tête User-Agent) |
Économie et finance
| Base de données | Fichier de référence | Ce qu'elle couvre |
|---|---|---|
| FRED | references/fred.md |
Séries chronologiques économiques US |
| Federal Reserve | references/federal-reserve.md |
Données monétaires/financières |
| BEA | references/bea.md |
PIB, comptes nationaux |
| BLS | references/bls.md |
Emploi, salaires, IPC |
| World Bank | references/worldbank.md |
Indicateurs de développement |
| ECB | references/ecb.md |
Taux de change en euros, statistiques monétaires |
| US Treasury | references/treasury.md |
Dette, courbes de rendement, données budgétaires |
| Alpha Vantage | references/alphavantage.md |
Actions, change, crypto |
| Data Commons | references/datacommons.md |
Graphe de connaissance statistique |
Sciences sociales et démographie
| Base de données | Fichier de référence | Ce qu'elle couvre |
|---|---|---|
| US Census | references/census.md |
Population, logement, enquêtes économiques |
| Eurostat | references/eurostat.md |
Statistiques UE |
| WHO GHO | references/who.md |
Indicateurs mondiaux de santé |