Recherche thématique · 18 juin 2026
R&D Autochtone × IA
Cartographie en six dimensions de l'intersection entre intelligence artificielle et peuples autochtones, faite pour nourrir la stratégie tech, éthique des données et second cerveau des villages côté Sacred Forest.
L'essentiel
Trois cadres opérationnels font consensus international : CARE Principles, OCAP et le Indigenous Protocol AI Position Paper. La controverse de fond — IA = révolution ou colonisateur ? — est tranchée pragmatiquement par les communautés : ni rejet ni adoption naïve, mais autochtonisation conditionnelle sous FPIC, infrastructures souveraines et small language models fine-tunés localement. Trois leviers concrets pour Sacred Forest : Mukurtu CMS + Local Contexts TK Labels pour la gouvernance, Mapeo + drones communautaires pour le monitoring, modèles open-weight self-hosted pour éviter le lock-in cloud Big Tech. Pépite à mobiliser : le Wíhaŋble S'a Center de Bard College (Suzanne Kite, 500k$ NEH 2024) prototype actuellement les sovereign data storage protocols.
Toutes les sources citées sont cliquables dans le corps du document. Bibliographie complète en bas de page : aller aux 35+ références →
Section 1 / 6
Trois cadres internationaux qui font consensus
Référencés par UNESCO, agences de financement, monde académique et grandes ONG dès qu'il y a des données autochtones en jeu.
CARE Principles
GIDA · Research Data Alliance, 2019
Complément aux principes FAIR. Quatre piliers : Collective benefit, Authority to control, Responsibility, Ethics. Standard désormais cité par institutions académiques, ONG et agences de financement quand des données autochtones sont en jeu.
Ownership, Control, Access, Possession
FNIGC, Canada
Précurseur de CARE, focus First Nations Canada. Plus prescriptif sur la propriété juridique des données. Trademark First Nations Information Governance Centre.
Indigenous Protocol AI Position Paper
Lewis et al. · CIFAR & Concordia, 2019
Aboutissement de 20 mois de travail collectif, deux workshops à Hawai'i. Cinq vignettes culturellement situées (Anishinaabe, Coquille, Kanaka Maoli/Blackfoot, Lakota, Euskaldunak) plus un prototype technique en langue 'ōlelo Hawai'i. Référence fondatrice du champ.
Schéma — Les 4 piliers CARE
Comment CARE complète FAIR
Collective Benefit
La valeur générée bénéficie équitablement aux communautés
Authority to Control
Droit au consentement libre, préalable et éclairé (FPIC)
Responsibility
Pour des relations positives, des capacités étendues, des langues et visions du monde respectées
Ethics
Minimiser les préjudices, justice, alignement UNDRIP
Cadre onusien — UNDRIP appliqué à l'IA
5 articles directement opérants
- Art. 18Droit de participer aux décisions par représentants choisis — gouvernance IA
- Art. 25Relation au territoire — compute footprint des datacenters
- Art. 29Interdiction stockage matériaux dangereux sans consentement — datacenters sur terres ancestrales
- Art. 31Droit de maintenir et protéger l'héritage culturel et les savoirs traditionnels — corpus, langues, sacred imagery
- Art. 32Droit de déterminer les stratégies pour terres et ressources — la donnée est une ressource
Standard onusien
FPIC — Free, Prior, Informed Consent
Pas un événement ponctuel mais un processus continu : libre (pas de coercition), préalable (avant collecte/usage), informé (langage et termes compréhensibles par la communauté), consentement (capacité de refuser).
« No use of Indigenous data or heritage should ever happen without Free, Prior and Informed Consent. » — Cultural Survival, 2025. Inclut training data, deployment, monetization, dérivés.
Section 2 / 6
Trois risques majeurs documentés
Les écueils qu'un programme comme Sacred Forest doit nommer et désamorcer dès la posture publique.
Datacenters et colonialisme extractif
Les datacenters ciblent zones rurales et tribales pour eau, électricité bon marché et incitations fiscales. +267 % du prix de l'énergie pour consommateurs locaux en Virginia. 6 milliards de gallons d'eau Google en 2023.
Source — Honor the Earth — Data Centers Myth vs Fact →Misrepresentation culturelle — cas Maasai 2024
Le State Department of Culture du Kenya a publié en 2024 des images IA d'attire Maasai où des hommes portaient un collier traditionnellement féminin. « This was not merely an aesthetic oversight. It was a cultural transgression. » Violation directe UNDRIP art. 31. Type d'erreur qu'un protocole de validation communautaire aurait évité.
Source — Cultural Survival — Indigenous Peoples and AI →Data colonialism et translation toxique
Abeba Birhane (Mozilla) théorise l'algorithmic colonisation of Africa. Application directe : pour la translation des langues amazoniennes, les corpus disponibles viennent souvent de prêtres coloniaux — classés potentially toxic data par les chercheurs IBM Brazil / USP, non utilisables sans accord communautaire explicite. Précédent critique pour tout projet NLP Pano (Huni Kuin / Kaxinawa).
Source — Birhane — Algorithmic Colonisation →Section 3 / 6
Sept outils opérationnels prêts à mobiliser
Rien à inventer from scratch — tout existe, certains sont déployés depuis 15 ans en Amazonie, Australie, Afrique, Pacifique. Cliquer sur chaque nom pour la fiche outil.
| Outil | Pertinence Sacred Forest |
|---|---|
| Mukurtu CMS ↗ | Brique fondationnelle « second brain village » |
| Local Contexts TK Labels ↗ | Système prêt à plug |
| Mapeo (Awana Digital) ↗ | Déjà déployé Amazon avec Seikopai (Ecuador) |
| Rainforest Connection Guardian 3 ↗ | Complément monitoring drone |
| Mistral / DeepSeek / Phi-4 ↗ | Évite lock-in cloud Big Tech |
| OpenDroneMap (ODM) ↗ | Couplé DJI consumer pour Volet drone |
| InkubaLM-0.4B (Lelapa AI) ↗ | Architecture transposable Pano |
Section 4 / 6
Quatre cas précédents — Amazonie et Pacifique
Sacred Forest n'est pas en territoire vierge. Voici les chantiers comparables qui ont déjà documenté ce qui marche et ce qui bloque.
Brésil — Rondônia, Acre
WWF Brésil — 25 kits drones livrés en 2022
Programme démarré 2019. 5 communautés indigènes équipées. Bénéficiaires confirmés : Uru-Eu-Wau-Wau (victimes de land grabs et trafic de bois). Étendre le rayon de surveillance, éviter le contact direct avec les criminels — 19 land defenders tués au Brésil en 2021.
Pérou — Loreto
36 communautés équipées drones
Base de données centralisée pour environmental crimes (Mongabay 2020). Modèle régional opérationnel, directement transposable au terrain Acre.
Aotearoa (Nouvelle-Zélande)
Te Hiku Media — précédent économique
Refus d'une offre Lionbridge à 45 $/heure pour transcrire des heures de Māori. Position : seul le peuple Māori bénéficie financièrement de sa langue. Création de licences propres. Précédent fort pour les Huni Kuin / Arhuaco face à toute sollicitation IA externe.
Brésil — São Paulo
IBM Brazil + USP — Guarani Mbya et Nheengatu
Co-création explicite, pause sur Mbya tant qu'il n'y a pas de consensus communautaire. Précédent direct latino-américain du modèle à construire pour les langues Pano (Huni Kuin, Kaxinawa).
Section 5 / 6
Quatre acteurs à explorer en priorité
Pistes d'exploration et premières portes d'entrée à creuser pour la phase 0 du programme ACRE.
Dr. Suzanne Kite
Oglala Lakota · Bard College
Directrice du Wíhaŋble S'a Center — premier centre US labellisé NEH dirigé par American Indians sur l'IA (500 000 $ NEH 2024). Développe les sovereign data storage protocols, modelés sur le travail Māori. Co-autrice du texte fondateur Making Kin with the Machines (MIT 2018).
Référence vivante, articulée. Possible mentor informel. Personnage potentiel pour le documentaire.
Local Contexts Hub
Multi-tribal partnership
Pour créer un compte sandbox et tester les TK Labels sur 3-5 assets pilotes Sacred Forest. Caler le protocole de labellisation dès la Mission 1.
Awana Digital / Mapeo
International, ex-Digital Democracy
Pour démo de l'application offline et ressources de déploiement Amazon. Précédent direct avec les Seikopai en Équateur, en partenariat avec Amazon Frontlines + Alianza Ceibo.
Mukurtu Support
WSU + Warumungu
Pour présentation d'un déploiement type Acre, ressources de formation, hosting options. Plateforme open source de gestion d'archives culturelles autochtones, déployée par des centaines de communautés mondialement.
Section 6 / 6
Quatre lectures à prioriser
Making Kin with the Machines
Lewis, Arista, Pechawis, Kite — MIT JoDS 2018
Texte fondateur du champ Indigenous AI.
Accéder ↗Indigenous Protocol AI Position Paper
Lewis et al. — CIFAR / Concordia 2019
Version anglaise PDF intégrale.
Accéder ↗CARE Principles for Indigenous Data Governance
Carroll et al. — Data Science Journal CODATA 2020
Le paper académique de référence.
Accéder ↗Indigenous Peoples and AI
Cultural Survival 2025
Defending Rights, Shaping the Future of Technology. UNDRIP × IA appliqué.
Accéder ↗Bibliographie complète
Sources & références
L'intégralité des liens consultés pour cette recherche, classés par catégorie. Tous les liens s'ouvrent dans un nouvel onglet.
Doctrine, frameworks et standards
- ▸ Indigenous Protocol AI Position Paper (Lewis et al.) ↗
- ▸ IP-AI — version anglaise PDF (Spectrum Concordia) ↗
- ▸ IP-AI — version 'ōlelo Hawai'i ↗
- ▸ CIFAR — Centering Indigenous Perspectives in designing AI ↗
- ▸ CARE Principles — texte intégral (RDA, 2019) ↗
- ▸ CARE Principles — paper académique (Data Science Journal CODATA 2020) ↗
- ▸ Global Indigenous Data Alliance (GIDA) ↗
- ▸ NNI Database — CARE Principles ↗
- ▸ Be FAIR and CARE (UW-Madison) ↗
- ▸ FPIC Manual — UN / FAO 2016 ↗
- ▸ Cultural Survival — Indigenous Peoples and AI (UNDRIP appliqué) ↗
Voix critiques et perspectives autochtones
- ▸ All My Relations Podcast × Dr. Keolu Fox — Indigenous AI: Revolution or Colonizer Bullshit? ↗
- ▸ Chronogram — Lakota-led AI Research at Bard (Suzanne Kite, mars 2026) ↗
- ▸ Suzanne Kite — portfolio ↗
- ▸ Karaitiana Taiuru — Compendium of Māori Data Sovereignty ↗
- ▸ Taiuru — Critical Analysis of Te Mana Raraunga ↗
- ▸ Taiuru — AI and data governance (PDF, VUW) ↗
- ▸ ReHuman — Dr. Lyla June Johnston ↗
- ▸ Montreal AI Ethics — Indigenous Data Sovereignty as Anti-Colonial Practice ↗
- ▸ Abeba Birhane — Algorithmic Colonisation of Africa ↗
Outils opérationnels
- ▸ Mukurtu CMS ↗
- ▸ Mukurtu — Mellon Foundation grant story ↗
- ▸ Local Contexts — Traditional Knowledge Labels (23 labels) ↗
- ▸ Local Contexts — About TK + BC Labels ↗
- ▸ Local Contexts — TK Notice ↗
- ▸ Awana Digital — Mapeo Seikopai Ecuador case ↗
- ▸ OneEarth — Digital Democracy / Mapeo grant ↗
- ▸ Amazon Frontlines — Territorial Mapping Program ↗
- ▸ Rainforest Connection ↗
- ▸ Rainforest Connection — Guardian 3 device ↗
- ▸ OpenDroneMap ↗
- ▸ Mistral AI (open-weight LLM) ↗
Cas Amazon — drones et monitoring autochtone
NLP, langues autochtones et small language models
- ▸ Brookings — Can Small Language Models Revitalize Indigenous Languages? (Tanner & Kerry, 2025) ↗
- ▸ AmericasNLP 2025 (13 langues autochtones des Amériques) ↗
- ▸ LT4All 2025 — Winning the Language Divide with AI ↗
- ▸ ArXiv — Generative AI in language preservation (2025) ↗
- ▸ ArXiv — InkubaLM-0.4B (Lelapa AI, langues africaines) ↗
- ▸ Divvun (outils Sámi, financement gouv. norvégien) ↗
- ▸ Giellatekno (Université de Tromsø) ↗
- ▸ Masakhane — recherche NLP collaborative panafricaine ↗
- ▸ ArXiv — Esethu Framework (licence data community-centric) ↗
La suite
L'autre note — Débrief & Vision Mik × Maah
Ce qui est sorti de nos trois échanges de juin et la vision opérationnelle qu'on a esquissée ensemble.
Lire la note 2 →