Ελληνικό λογισμικό ξεσκεπάζει «ανώνυμους» της κοινωνικής δικτύωσης

Μπορεί να αναλύει τα κείμενα ανώνυμων συγγραφέων στα μέσα κοινωνικής δικτύωσης και να προβλέπει σωστά το φύλο, την ηλικία τους, αλλά και ψυχολογικά χαρακτηριστικά της προσωπικότητάς τους.

Το πρωτοποριακό για τα ελληνικά δεδομένα λογισμικό ανέπτυξε ο Έλληνας ερευνητής Γιώργος Μικρός και οι συνεργάτες του κάνει αυτόματη αναγνώριση φύλου του συγγραφέα με ακρίβεια πάνω από 90% για μικρά κείμενα όπως στο Twitter, και έχει ακρίβεια προσέγγισης 100% για μεγαλύτερες αναρτήσεις στα κοινωνικά δίκτυα ή για ακόμη μεγαλύτερα κείμενα (π.χ. των 5.000 λέξεων). Ακόμη μπορεί να εκτιμήσει με ποσοστό επιτυχίας από 40 έως 70% ηλικία και χαρακτηριστικά  γνωρίσματα  της προσωπικότητας. Το λογισμικό φυσικά και  μιλάει ξένες γλώσσες  εκτός από ελληνικά όπως αγγλικά, ισπανικά και ιταλικά.

Σε συνέντευξη του στο ΑΠΕ-ΜΠΕ ο δημιουργός του τονίζει ότι υπάρχει διαφορετική βιολογική βάση στο γλωσσικό μηχανισμό των ανδρών και των γυναικών, ενώ οι γυναίκες εμφανίζουν καλύτερη επεξεργασία της γλώσσας.

Όπως λέει, οι γυναίκες χρησιμοποιούν και τα δύο ημισφαίρια για την παραγωγή του λόγου, ενώ οι άνδρες μόνο το αριστερό. Επίσης οι γυναίκες υπερτερούν έναντι των ανδρών στις γλωσσικές δοκιμασίες και ο λόγος τους είναι συνήθως πιο «επίσημος».

Ο διαφορετικός τρόπος που εκφράζονται τα δύο φύλα, είναι δυνατό να αναγνωρισθεί από τους αλγόριθμους τεχνητής νοημοσύνης του προγράμματος λογισμικού που έχει αναπτύξει ο κ. Μικρός και το οποίο μπορεί να αναλύσει ένα ανώνυμο κείμενο, συμπεραίνοντας αν έχει γραφτεί από άνδρα ή γυναίκα.

Λογισμικά αυτού του είδους ανήκουν στο πεδίο της Υφομετρίας (Stylometry), που συνδυάζει τεχνικές της Γλωσσολογίας και της Πληροφορικής. Ο κ. Μικρός ξεκίνησε να αναπτύσσει το συγκεκριμένο πρόγραμμα το 2007 και ακόμη το τελειοποιεί, σε συνεργασία με ερευνητές στις ΗΠΑ.

Οι πρακτικές εφαρμογές του προγράμματος είναι πολλές. Κατ’ αρχήν στην εγκληματολογία (π.χ. για την ταυτοποίηση του συγγραφέα μιας τρομοκρατικής προκήρυξης ή μιας ανώνυμης απειλητικής επιστολής), στη φιλολογία (π.χ. για την ανίχνευση της λογοτεχνικής πατρότητας παλαιών κειμένων), στον εντοπισμό κάθε είδους λογοκλοπών (π.χ. σε μια φοιτητική ή άλλη εργασία), στη διερεύνηση της δυναμικής της κοινής γνώμης στο διαδίκτυο (π.χ. μέσω της ανάλυσης της συναισθηματικής φόρτισης που εμπεριέχουν οι αναρτήσεις των κοινωνικών δικτύων για έναν πολιτικό ή μια εταιρεία), στην εκπαίδευση κ.α.

Ο Γιώργος Μικρός, είναι  καθηγητής Υπολογιστικής & Ποσοτικής Γλωσσολογίας και πρόεδρος του Τμήματος Ιταλικής Γλώσσας & Φιλολογίας του Πανεπιστημίου Αθηνών, καθώς και αντιπρόεδρος της Διεθνούς Εταιρείας Ποοσοτικής Γλωσσολογίας.

ΠΗΓΗ: ΑΠΕ -ΜΠΕ

Όλες οι Ειδήσεις από την Ελλάδα και τον Κόσμο,  στο ertnews.gr
Διάβασε όλες τις ειδήσεις μας στο Google
Κάνε like στη σελίδα μας στο Facebook
Ακολούθησε μας στο Twitter
Κάνε εγγραφή στο κανάλι μας στο Youtube
Προσοχή! Επιτρέπεται η αναδημοσίευση των πληροφοριών του παραπάνω άρθρου (όχι αυτολεξεί) ή μέρους αυτών μόνο αν:
– Αναφέρεται ως πηγή το ertnews.gr στο σημείο όπου γίνεται η αναφορά.
– Στο τέλος του άρθρου ως Πηγή
– Σε ένα από τα δύο σημεία να υπάρχει ενεργός σύνδεσμος
heading. Must include LSI keywords naturally.We must pick a player behavior pattern: let’s pick “mobile gameplay during brief, repeated visits”. So the article will focus on playing on mobile, short visits, quick decision making, etc.Also must alternate between short punchy sentences and longer explanations.Must avoid more than 150 plain text in a row; use lists and subheadings.Need at least two bullet lists or numbered lists for every 700 words. So for 2200 words, we need about 3-4 lists. We’ll include lists in several sections.Also we need at least a final conclusion section with a call to action. That will be a final section with CTA.We should use tags for paragraphs, and h2, h3. Use ul li lists.We must not use bold text.Let’s plan sections:1. Intro (h2) – introduction about Hugo Casino, mobile focus, quick sessions.2. Mobile‑first design (h2) – layout, responsiveness, no app.3. Game selection for quick bursts (h2) – highlight slots, live casino, crash, drops & wins, Hugo’s special games; but keep mobile focus; mention providers but not exhaustive.4. Quick‑play features (h2) – auto‑reels, fast spin, one‑click bets, etc.5. Session flow example (h3) – a typical 5‑minute session on the go.6. Risk control & bankroll management (h2) – small bets, quick stops.7. Bonus usage in mobile sessions (h2) – how to claim free spins, reload bonuses quickly.8. Payment options for mobile (h2) – crypto, e-wallets, instant deposits.9. Loyalty & rewards on the fly (h2) – VIP tiers, cashback, how to track via mobile.10. Community & social play (h2) – chat, leaderboard, social sharing on mobile.11. Conclusion & CTA (h2).We need at least 10-12 sections; we have 11.Each section at least 200 words. Must keep within word count.Let’s approximate: each section ~190-210 words. Let’s aim for 210 words each => 2310 words. Within allowed 2000? Wait requirement: between 1800-2000 words strictly mandatory. So cannot exceed 2000. So we must target 200 words? Let’s recalc: If each at least 200 words and we have 10-12 sections, min total =200*10=2000 words if 10 sections exactly at minimum; that’s okay: exactly 2000 words is allowed. So we can do exactly 10 sections of 200 words each =2000 words exactly. But we need at least two bullet lists or numbered lists per 700 words: With 2000 words, that’s ~3 lists total needed. We can put lists in some sections.But constraint: each section at least 200 words; we can do exactly 200 words per section; but writing precisely 200 words is tough but we can approximate.We also need no more than 150 plain text in a row; use lists and subheadings.We also must have final conclusion with CTA.Ok, let’s design:Sections:1 h2 Intro2 h2 Mobile Design3 h2 Game Selection4 h2 Quick Play Features5 h2 Sample Session Flow6 h2 Bankroll & Risk Control7 h2 Bonus Play on Mobile8 h2 Payments & Instant Deposits9 h2 Loyalty & Rewards10 h2 Final CTABut we need at least two bullet lists per 700 words: For 2000 words total, we need at least three bullet lists overall. We can include one list in section 3, one in section 6, one in section 9 maybe.Also we need to alternate short and long sentences; keep within word counts.Let’s start writing each section in about 190-210 words.We’ll write each paragraph inside tags and use lists.Let’s start: … needs brand name combined with LSI keywords naturally.Example: Hugo Casino: Mobile Slots & Quick Wins for On‑The‑Go Players