In einer unserer letzten Blogs haben wir das Data Mining mittels Simulationen und den Vergleich mit einigen der in R implementierten Klassifizierungsalgorithmen kurz vorgestellt. Hier wollen wir den Sachverhalt anhand der in R verfügbaren Testdaten zu Brustkrebserkennung etwas vertiefen und dabei die benutzerdefinierte Verteilung von MC FLO näher vorstellen.
Im Vergleich zur "R", der klassischen Umgebung mit der Statistiker Analysen durchführen, möchten wir hier die grundsätzliche Vorgehensweise zur Lösung von Data-Mining Problemen mit der Monte-Carlo Simulation demonstrieren und dabei bewusst auf die Marketingbegriffe verzichten. Durch den hier vorgestellten Ansatz schaffen wir Transparenz, was den Nachvollzug gewährleistet.