Skip to main content
22 February 2024 07:53

Προσωπικά δεδομένα στον «βωμό» της AI;

Της Ελένης Μιχαηλίδου

Οι χρήστες του Facebook αυξάνονται, σύμφωνα με τα τελευταία αποτελέσματα της Meta. O Μark Ζuckerberg θέλει να εκμεταλλευτεί αυτές τις αυξητικές τάσεις χρησιμοποιώντας δεδομένα χρηστών από Facebook και Instagram για να δημιουργήσει εφαρμογές τεχνητής νοημοσύνης γενικού σκοπού. Αυτό μπορεί να έχει σαν αποτέλεσμα, οι χρήστες των μέσων κοινωνικής δικτύωσης να «πληρώσουν» την ανάπτυξη της AI με διαρροές στα προσωπικά τους δεδομένα.

«Το επόμενο “βήμα-κλειδί” για εμάς θα είναι η μάθηση από τα μοναδικά δεδομένα και την ανάδραση των προϊόντων μας. Σε Facebook και Instagram υπάρχουν εκατοντάδες δισεκατομμύρια εικόνες και δεκάδες δισεκατομμύρια βίντεο που μοιράζονται δημόσια, που θεωρούμε ότι είναι περισσότερα από τη βάση δεδομένων, Common Crawl, και οι χρήστες επίσης μοιράζονται δημόσια μεγάλους αριθμούς κειμένων μέσω των υπηρεσιών μας». Το θέμα που αναφέρει ο Zuckerberg σχετικά με το Common Crawl προκάλεσε την έκπληξη αναλυτών του τομέα τεχνολογίας, καθώς το συγκεκριμένο είναι ήδη τεράστιο με 250 δισεκατομμύρια ιστοσελίδες επί 17 χρόνια, γράφει το Bloomberg. Πρόκειται για ένα από τα μεγαλύτερα και πιο δημοφιλή αρχεία δεδομένων που αξιοποιούν τα συστήματα ΑΙ σήμερα. Όταν η OpenAI λανσάρισε το μοντέλο γλώσσας GPT-3, το 2020, περίπου 60% των κειμένων που χρησιμοποιήθηκαν για να εκπαιδεύσουν το μοντέλο προήλθε από το Common Crawl. Αν ο όγκος δεδομένων της Meta είναι όντως ακόμη μεγαλύτερος, αυτό σημαίνει ότι μπορεί, θεωρητικά, να δημιουργήσει «εξυπνότερη» τεχνητή νοημοσύνη, και αυτό γιατί η έρευνα κατέδειξε ότι η εκπαίδευση μοντέλων ΑΙ με περισσότερα δεδομένα τείνει να τα κάνει ακριβέστερα και ικανότερα.

Τέλος, αν ο Zuckerberg θέλει να δημιουργήσει ένα ισχυρότερο chatbot, ο όγκος πληροφοριών που έχει είναι ιδιαίτερα πολύτιμος και για έναν ακόμη λόγο, καθώς κείμενα που περιέχουν ανθρώπινους διαλόγους είναι κρίσιμα για την εκπαίδευση των αποκαλούμενων μοντέλων συζήτησης. Ενώ ο Zuckerberg ανέφερε πως η ομάδα του χτίζει «γενική νοημοσύνη» εδώ και μια δεκαετία, προσέθεσε ότι μόνο τώρα θα στραφεί σε χρήση δεδομένων χρηστών.

Τεύχος 454

ΑΛΛΑ ΑΡΘΡΑ ΣΕ ΑΥΤΗ ΤΗΝ ΚΑΤΗΓΟΡΙΑ