Hier veröffentlichen wir Forschungsarbeiten, die aus unserer Produktentwicklung entstehen.
Here we publish research that emerges from our product work.
8. April 2026April 8, 2026Vector Privacy
Keyed Phase Transform for Private Vector Retrieval
Verschlüsselung schützt gespeicherte Daten. Wer Zugriff auf die Vektoren hat, kann trotzdem semantisch suchen. KPT schließt diese Lücke: mit falschem Key kollabiert der gesamte Score-Raum zu Noise. Keine Retrieval-Signale, keine rekonstruierbare Struktur.
Encryption protects stored data. Anyone with vector access can still search semantically. KPT closes that gap: with a wrong key, the entire score space collapses to noise. No retrieval signals, no recoverable structure.
31. März 2026March 31, 2026Clustering Infrastructure
Automatic Skill Clustering at Scale: From 30k to 307k Labels
Wie die alte Pipeline aus Stella, PCA, t-SNE und HDBSCAN auf voller Größe scheiterte und durch qwen3-embedding, Mutual-kNN und Leiden ersetzt wurde. Ergebnis: eine belastbare Produktionsstruktur für 307k bilinguale Skills.
How the old Stella, PCA, t-SNE, and HDBSCAN pipeline failed at full scale and was replaced by qwen3-embedding, mutual kNN, and Leiden. The result: a durable production structure for 307k bilingual skills.