ΘΕΜΑΤΑ

ΑΝΤΙΤΗΛΟΣ1 ΑΡΚΟΙ2 ΑΡΚΟΝΗΣΟΣ3 ΑΡΜΑΘΙΑ1 ΑΣΤΑΚΙΔΑ1 ΑΣΤΥΠΑΛΑΙΑ11 ΑΥΓΟ1 ΓΑΔΑΡΟΣ7 ΓΑΙΑ4386 ΓΛΑΡΟΣ1 ΓΥΑΛΙ34 ΔΙΒΟΥΝΙΑ2 ΔΟΛΙΧΗ1 ΕΛΛΑΔΑ1935 ΖΑΦΟΡΑΣ ΜΑΚΡΥΣ1 ΙΑΣΟΣ4 ΙΜΙΑ2 ΚΑΛΑΒΡΟΣ1 ΚΑΛΑΜΑΡΙΑ4 ΚΑΛΟΓΕΡΟΣ1 ΚΑΛΟΛΙΜΝΟΣ2 ΚΑΛΥΜΝΟΣ169 ΚΑΜΗΛΟΝΗΣΙ2 ΚΑΝΔΕΛΙΟΥΣΑ3 ΚΑΡΠΑΘΟΣ13 ΚΑΣΟΣ8 ΚΑΣΤΕΛΛΟΡΙΖΟ20 ΚΑΣΤΡΙ1 ΚΕΔΡΕΑΙ[SEDIR]1 ΚΕΡΑΜΟΣ1 ΚΙΝΑΡΟΣ1 ΚΝΙΔΟΣ26 ΚΟΛΟΦΩΝΑΣ1 ΚΟΥΝΕΛΙ1 ΚΡΕΒΑΤΙΑ1 ΚΩΣ2485 ΛΕΒΙΘΑ3 ΛΕΙΨΟΙ7 ΛΕΠΙΔΑ1 ΛΕΡΟΣ32 ΛΕΣΒΟΣ1 ΛΥΤΡΑ1 ΜΥΝΔΟΣ1 ΝΕΚΡΟΘΗΚΗ1 ΝΕΡΟΝΗΣΙ1 ΝΗΠΟΥΡΙ1 ΝΗΣΟΣ1 ΝΙΜΟΣ1 ΝΙΣΥΡΟΣ207 ΞΕΝΑΓΟΡΑ ΝΗΣΟΙ1 ΟΦΙΔΟΥΣΑ1 ΠΑ.ΦΩ.ΚΩ43 ΠΑΤΜΟΣ30 ΠΑΧΕΙΑ6 ΠΕΝΤΙΚΟΝΗΣΙΑ1 ΠΕΤΡΟΚΑΡΑΒΟ1 ΠΙΑΤΑ1 ΠΙΤΤΑ1 ΠΛΑΤΕΙΑ1 ΠΛΑΤΗ2 ΠΟΝΤΙΚΟΥΣΑ1 ΠΡΑΣΟ1 ΠΡΑΣΟΝΗΣΙ1 ΠΡΑΣΟΝΗΣΙΑ1 ΠΡΑΣΟΥΔΑ ΚΑΤΩ1 ΠΥΡΓΟΥΣΑ5 ΡΟΔΟΣ153 ΡΩ1 ΣΑΒΟΥΡΑ1 ΣΑΜΟΣ15 ΣΑΝΤΟΡΙΝΗ89 ΣΑΡΑΚΙ1 ΣΑΡΙΑ1 ΣΕΣΚΛΙ1 ΣΟΧΑΣ1 ΣΤΡΟΒΙΛΟΣ1 ΣΤΡΟΓΓΥΛΗ[ΑΓΑΘΟΝΗΣΙΟΥ]1 ΣΤΡΟΓΓΥΛΗ[ΜΕΓΙΣΤΗΣ]1 ΣΤΡΟΓΓΥΛΗ[ΝΙΣΥΡΟΥ]3 ΣΥΜΗ40 ΣΥΡΝΑ4 ΣΦΥΡΝΑ1 ΤΕΛΕΝΔΟΣ1 ΤΕΡΜΕΡΑ1 ΤΗΛΟΣ28 ΤΡΑΓΟΝΕΡΑ1 ΤΡΑΓΟΥΣΑ1 ΤΣΟΥΚΑ1 ΦΑΡΜΑΚΟΝΗΣΙ3 ΧΑΛΚΗ15 ΨΕΡΙΜΟΣ22
Εμφάνιση περισσότερων

Ρομπότ που ονειρεύονται...

Μπορούμε να δούμε μόνο ό,τι νομίζουμε ότι είναι εφικτό...

Το δοκιμάζω τώρα. Αυτό θα επιτρέψει στα ρομπότ να εκπαιδεύσουν σε ένα «όνειρο» οποιαδήποτε νέα δεξιότητα με δισεκατομμύρια πιθανές δοκιμές και λάθη για να φτάσουν σε μια ικανότητα, χωρίς να χρειάζεται να περάσουν από πραγματικές φυσικές δοκιμές. 

Η Google DeepMind εισήγαγε μια σημαντική πρόοδο στη ρομποτική με το Gemini Robotics 1.5, ένα σύστημα που επιτρέπει στους πράκτορες τεχνητής νοημοσύνης να μαθαίνουν σύνθετες φυσικές εργασίες μέσω προσομοιωμένων περιβαλλόντων, που περιγράφονται ως «όνειρα». Αυτή η εξέλιξη περιγράφεται στην εργασία του Σεπτεμβρίου 2025, «Gemini Robotics 1.5: Φέρνοντας τους πράκτορες τεχνητής νοημοσύνης στον φυσικό κόσμο» από την Carolina Parada και την ομάδα DeepMind Robotics [1]. 

Η παραδοσιακή ρομποτική βασίζεται σε εκτεταμένες φυσικές δοκιμές και λάθη, αλλά το Gemini Robotics 1.5, που περιλαμβάνει το μοντέλο Όραμα-Γλώσσα-Δράση και την παραλλαγή Ενσωματωμένης Συλλογιστικής, χρησιμοποιεί προσομοιώσεις λανθάνοντος χώρου για να μοντελοποιήσει και να βελτιώσει εικονικά τις στρατηγικές εργασιών. Αξιοποιώντας τις πολυτροπικές δυνατότητες του Gemini 2.0, το σύστημα επεξεργάζεται οπτικές εισόδους, οδηγίες φυσικής γλώσσας και κινητικές εντολές για να εκτελεί εργασίες με προσαρμοστικότητα. Για παράδειγμα, όταν λαμβάνει οδηγίες για «ταξινόμηση ανακυκλώσιμων υλικών σε έναν ακατάστατο κάδο», το ER 1.5 αναζητά εξωτερικά δεδομένα, όπως ιδιότητες υλικών μέσω της Αναζήτησης Google, προσομοιώνει στρατηγικές ταξινόμησης και βελτιστοποιεί την αποδοτικότητα, επιτυγχάνοντας υψηλά ποσοστά επιτυχίας σε δοκιμές πραγματικού κόσμου χωρίς προηγούμενη φυσική εξάσκηση. 

Η εργασία παρέχει συγκεκριμένα παραδείγματα: Ένα ανθρωποειδές ρομπότ, που αναπτύχθηκε με την Apptronik, πλοηγείται σε ένα γεμάτο γραφείο για να παραδώσει έγγραφα, αποφεύγοντας εμπόδια προσομοιώνοντας διαδρομές. Ένα άλλο παράδειγμα δείχνει έναν ρομποτικό βραχίονα που συναρμολογεί ένα κιτ ιατρικών προμηθειών, προσαρμόζοντας τη δύναμη λαβής για εύθραυστα αντικείμενα όπως σύριγγες με βάση εικονικά σενάρια. Αυτές οι δυνατότητες βασίζονται σε προηγούμενη έρευνα του DeepMind, όπου η προσομοιωμένη εκπαίδευση βελτίωσε την απόδοση της Τεχνητής Νοημοσύνης σε εικονικές εργασίες έως και 880% [2]. 

Εφαρμοσμένη σε φυσικά ρομπότ, αυτό επιτρέπει τη γενίκευση μηδενικών βολών σε νέα περιβάλλοντα. Οι επιπτώσεις είναι εκτεταμένες. Πρώτον, η εικονική εκπαίδευση μειώνει την εξάρτηση από δαπανηρά φυσικά πρωτότυπα. Ένα ρομπότ αποθηκάριος, για παράδειγμα, θα μπορούσε να βελτιστοποιήσει τις στρατηγικές στοίβαξης παλετών εν μία νυκτί, ελαχιστοποιώντας τη φθορά και το κόστος ενέργειας. Δεύτερον, η επεξεργασία φυσικής γλώσσας και η προσαρμοστικότητα του συστήματος είναι κατάλληλες για εφαρμογές όπως η παροχή βοήθειας σε καταστροφές, όπου τα ρομπότ θα μπορούσαν να περιηγηθούν σε ερείπια για να εντοπίσουν επιζώντες, ή η υγειονομική περίθαλψη, βοηθώντας στην κινητικότητα των ασθενών με βάση λεκτικές οδηγίες. Ωστόσο, οι προκλήσεις παραμένουν: οι προκαταλήψεις στα δεδομένα εκπαίδευσης ή οι ελαττωματικές προσομοιώσεις θα μπορούσαν να οδηγήσουν σε σφάλματα, όπως η εσφαλμένη ερμηνεία εντολών σε διαφορετικά πολιτισμικά πλαίσια. 

Το benchmark Asimov της DeepMind δοκιμάζει τη λήψη ηθικών αποφάσεων, αλλά η συνεχής εποπτεία είναι απαραίτητη. Το Gemini Robotics 1.5 αντιπροσωπεύει ένα βήμα προς τα αυτόνομα ρομπότ που μαθαίνουν μέσω της φαντασίας, επαναπροσδιορίζοντας τον ρόλο της Τεχνητής Νοημοσύνης στον φυσικό κόσμο.

Brian Roemmele

https://x.com/BrianRoemmele/status/1975406803476488422

[1].Parada, C., & DeepMind Robotics Team. (2025). Gemini Robotics 1.5: Bringing AI Agents into the Physical World.  https://deepmind.google/discover/blog/gemini-robotics-15-brings-ai-agents-into-the-physical-world/  

[2].DeepMind. (2016). DeepMind research on simulated training. https://deepmind.google/discover/blog/

ΤΕΛΕΥΤΑΙΕΣ ΑΝΑΡΤΗΣΕΙΣ

Recent Posts Widget