About the work
Questo lavoro propone un’architettura RAG locale, modulare e completamente auditabile, progettata per affrontare tre limiti strutturali dei sistemi contemporanei: l’opacità delle pipeline, la proliferazione incontrollata delle copie testuali e la mancanza di separazione tra domini epistemici eterogenei. Il modello introduce una forma radicalmente alternativa di organizzazione della conoscenza, basata sulle “isole epistemiche”, spazi semantici coerenti e autonomi nei quali documenti omogenei per natura, finalità e linguaggio vengono trattati come ecosistemi informativi chiusi, garantendo coerenza interna e riducendo l’entropia concettuale tipica degli archivi monolitici. A questa struttura si integra il principio di Zero Content Duplication (ZCD), che impone l’esistenza di una sola rappresentazione canonica del testo all’interno del sistema e vieta qualsiasi duplicazione non necessaria, riducendo drasticamente rischi di incoerenza, dispersione semantica, attacchi alla privacy e difficoltà di aggiornamento.
L’architettura include anche un modello di auditabilità end-to-end, che permette di ricostruire in maniera trasparente ogni gesto della pipeline — dall’ingestione alla generazione — e consente di verificare quale versione di un documento sia stata utilizzata, come sia stata trasformata, quale embedding l’abbia rappresentata e quali vettori abbiano determinato una specifica risposta. Questo approccio rende possibile un uso responsabile dell’AI nei settori critici, come sanità, normativa, pubblica amministrazione, industria tecnica e governance aziendale, dove la trasparenza non è un valore accessorio ma un requisito strutturale.
Il modello qui presentato non è dunque un semplice miglioramento tecnico, ma l’espressione di una filosofia della conoscenza distribuita: un’epistemologia applicata che assume la forma dell’arcipelago — molte isole, ciascuna coerente al proprio interno ma interoperabile — e che rinuncia alla logica delle grandi infrastrutture centralizzate, proponendo un’alternativa locale, verificabile, cognitiva e resistente. L’insieme delle soluzioni descritte mostra che è possibile costruire sistemi RAG che non solo funzionano, ma che rendono conto del proprio funzionamento, restituendo all’utente un controllo pieno sui contenuti, sulle trasformazioni e sulle risposte prodotte dall’intelligenza artificiale.
AI Availability Declaration
This work cannot be made available to AI systems.
Print work information
Work information
Title KBA – An Archipelago Knowledge Base approach to AI
Questo lavoro propone un’architettura RAG locale, modulare e completamente auditabile, progettata per affrontare tre limiti strutturali dei sistemi contemporanei: l’opacità delle pipeline, la proliferazione incontrollata delle copie testuali e la mancanza di separazione tra domini epistemici eterogenei. Il modello introduce una forma radicalmente alternativa di organizzazione della conoscenza, basata sulle “isole epistemiche”, spazi semantici coerenti e autonomi nei quali documenti omogenei per natura, finalità e linguaggio vengono trattati come ecosistemi informativi chiusi, garantendo coerenza interna e riducendo l’entropia concettuale tipica degli archivi monolitici. A questa struttura si integra il principio di Zero Content Duplication (ZCD), che impone l’esistenza di una sola rappresentazione canonica del testo all’interno del sistema e vieta qualsiasi duplicazione non necessaria, riducendo drasticamente rischi di incoerenza, dispersione semantica, attacchi alla privacy e difficoltà di aggiornamento.
L’architettura include anche un modello di auditabilità end-to-end, che permette di ricostruire in maniera trasparente ogni gesto della pipeline — dall’ingestione alla generazione — e consente di verificare quale versione di un documento sia stata utilizzata, come sia stata trasformata, quale embedding l’abbia rappresentata e quali vettori abbiano determinato una specifica risposta. Questo approccio rende possibile un uso responsabile dell’AI nei settori critici, come sanità, normativa, pubblica amministrazione, industria tecnica e governance aziendale, dove la trasparenza non è un valore accessorio ma un requisito strutturale.
Il modello qui presentato non è dunque un semplice miglioramento tecnico, ma l’espressione di una filosofia della conoscenza distribuita: un’epistemologia applicata che assume la forma dell’arcipelago — molte isole, ciascuna coerente al proprio interno ma interoperabile — e che rinuncia alla logica delle grandi infrastrutture centralizzate, proponendo un’alternativa locale, verificabile, cognitiva e resistente. L’insieme delle soluzioni descritte mostra che è possibile costruire sistemi RAG che non solo funzionano, ma che rendono conto del proprio funzionamento, restituendo all’utente un controllo pieno sui contenuti, sulle trasformazioni e sulle risposte prodotte dall’intelligenza artificiale.
Work type Technical
Tags auditability, domain separation, ai transparency, knowledge islands, local-first computing, document intelligence, semantic governance, epistemic stability, on-premise ai systems, local ai, cognitive architecture, retrieval-augmented generation, compliance-oriented ai, zero content duplication, responsible ai, semantic noise reduction, privacy-preserving ai, embedding discipline, text normalization, vector spaces
-------------------------
Registry info in Safe Creative
Identifier 2512023903674
Entry date Dec 2, 2025, 4:48 PM UTC
License All rights reserved
-------------------------
Copyright registered declarations
Author 100.00 %. Holder Alessandro Poli. Date Dec 2, 2025.
Information available at https://www.safecreative.org/work/2512023903674-kba-an-archipelago-knowledge-base-approach-to-ai