Білл Гейтс якось сказав, що люди «переоцінюють те, що вони можуть зробити за один рік, і недооцінюють те, що вони можуть зробити за 10 років». Індивідуальні прориви мають тенденцію накопичуватися нелінійним чином, доки раптом у центрі уваги не потрапляє майбутнє. Як говорить стара приказка, це відбувається двома способами: поступово, а потім раптово . І оскільки ми завершуємо шалені 12 місяців технологічного прогресу, я вважаю справедливим сказати, що 2023 рік став «раптом».
Минулого місяця ми відсвяткували 10-ту річницю заснування FAIR, нашої лабораторії фундаментальних досліджень ШІ. Коли ми запустили його в 2013 році, в індустрії панував надзвичайний ажіотаж щодо ролі ШІ в майбутньому, і перші програми машинного навчання вже відігравали центральну роль у Facebook. Тоді мало хто міг уявити, наскільки вражаючим буде прогрес. Насправді навіть лише два роки тому багато хто міг поставити це під сумнів.
З огляду на 2024 рік, наближається ще одна значна віха: виповниться 10 років відтоді, як Meta почала працювати над обчислювальною платформою майбутнього в Reality Labs. Ці дві новітні технології — штучний інтелект і метавсесвіт — представляють найбільшу довгострокову ставку Meta на майбутнє. І в 2023 році ми почали спостерігати, як ці два технологічні шляхи перетинаються у формі продуктів, доступних величезній кількості людей.
ШІ
Одним із визначних моментів року було спостереження за тим, як Llama та Llama 2 були сприйняті спільнотою розробників, з понад 100 мільйонами завантажень і постійними вдосконаленнями, які надходять від організацій з усього світу, коли вони ітерують. В Індії Джіо швидко налаштував його , щоб створити новий інструмент для обслуговування понад півмільярда клієнтів. І таблиця лідерів Open LLM HuggingFace поповнилася вражаючими проектами, створеними на основі Llama 2, які є лідерами. Це лише кілька з понад 13 000 варіантів Llama, які там розміщені.
Як і будь-яка нова технологія, ШІ матиме найбільший вплив, коли вона стане доступною для всіх. Не так давно можливість створювати красиві зображення за допомогою текстових підказок була фактично недоступною для більшості людей. Але сьогодні ми додаємо такі інструменти, як спільне створення зображень, розмовні помічники, помічники в написанні та розумні редактори зображень у продукти, якими вже користуються мільярди людей у всьому світі.
Зміна платформи
Зміни, які ми спостерігаємо за останній рік, вказують на те, що штучний інтелект може стати основним способом взаємодії людей з машинами. Сцена створена для нових видів пристроїв, які можуть сприймати, розуміти та взаємодіяти з навколишнім світом у спосіб, який ніколи раніше не був можливим.
Наші окуляри Ray-Ban Meta зі штучним інтелектом показують один із таких шляхів. Наш новий помічник Meta AI поєднує бачення та розуміння мови, щоб побачити світ з вашої точки зору та працювати з вами, щоб зрозуміти його сенс. І ми тестуємо нові мультимодальні можливості ШІ на окулярах. Якщо це ввімкнено, вони можуть перекласти іноземну мову, яку ви намагаєтеся прочитати, або придумати кумедний підпис для фотографії, яку ви зробили. І вони можуть робити все це без рук, вам не потрібно діставати телефон або керувати програмою.
Ми вважаємо, що одним із найпотужніших проявів передового штучного інтелекту будуть помічники, які зможуть розуміти світ навколо вас і допомагати вам протягом дня, зрештою, без запитів. Окуляри є ідеальним форм-фактором для цього — вони можуть бачити та чути світ з вашої точки зору, вони вже соціально прийнятні, їх можна носити цілий день, і вони дозволяють вам залишатися повністю присутніми в даному моменті.
У Reality Labs ми інвестували роки в дослідження технологій, необхідних для цього — таких, як датчики з наднизьким енергоспоживанням, постійно ввімкнені та системи машинного сприйняття, здатні зрозуміти ваш контекст. Ми не просто відкриваємо новий вид пристрою — ми будемо просувати його вперед протягом багатьох років.
Змішана реальність і просторові обчислення представляють інший шлях вперед. Це не просто поступове вдосконалення парадигми персональних комп’ютерів, яка домінувала протягом останніх 50 років. Вони представляють фундаментальну зміну, яка тільки починає привертати увагу.
Зробити ці нові технології доступними для якомога більшої кількості людей було головним пріоритетом для Reality Labs протягом багатьох років, тому випуск першої масової гарнітури змішаної реальності у вересні цього року став для нас ще однією подією 2023 року.
За кілька місяців після запуску Meta Quest 3 сім із 20 найкращих додатків є додатками змішаної реальності. Ми бачимо сильні сигнали того, що люди дійсно цінують цей досвід. У нашому магазині вже є сотні додатків змішаної реальності, де більшість користувачів випробували функції змішаної реальності. Бачити, що відбувається, коли багато людей отримують у свої руки таку нову технологію, було чудово:
У 2024 році ми побачимо, як цей прогрес прискориться, оскільки більше людей отримають доступ до змішаної реальності, а розробники навчаться використовувати її потужність. Незалежно від того, чи це захоплюючий перегляд NBA на Xtadium, чи абсолютно новий підхід до вивчення музики на Pianovision, ми вже бачимо, як MR забезпечує враження, які були б неможливі на будь-якому іншому пристрої.
Довгий погляд
Робити довгострокові ставки на нові технології нелегко. Це не гарантовано спрацює, і це, звичайно, недешево. Це також одна з найцінніших речей, які може зробити технологічна компанія — і єдиний спосіб залишатися актуальною в довгостроковій перспективі. Спостереження за двома найбільшими довгостроковими технологічними ставками Meta, як зрілими, так і перетинаються цього року, стало надзвичайно потужним нагадуванням про важливість підтримки здорових інвестицій у технології майбутнього. І це дало нам ще чіткіше уявлення про інновації, які ми маємо запровадити протягом наступного десятиліття.
У сфері штучного інтелекту це означає повну швидкість щодо того, що буде далі: що буде після сучасного покоління магістра права та генеративного штучного інтелекту? Більшість дослідників погоджуються, що є ще багато можливостей для створення більших і кращих моделей мови, зображень і відео за допомогою сучасних технологій. Але ще попереду фундаментальні прориви та абсолютно нові архітектури, і наші дослідницькі групи зі штучного інтелекту в Meta йдуть на шляху до їх відкриття.
Це означає постійне дослідження таких галузей, як втілений штучний інтелект, який спрямований на створення моделей, які сприймають світ так, як його сприймають люди. Наші дослідники вважають, що шлях до штучного інтелекту людського рівня потребуватиме систем, які мають глибше розуміння того, як влаштований світ , і наші команди вже досягли прогресу в цьому, а попереду ще роки роботи.
А в Reality Labs наші дослідники просувають деякі з найперспективніших технологій, які зроблять наступну обчислювальну платформу можливою. Протягом багатьох років це дослідження призвело до таких проривів, як млинцеві лінзи в Quest Pro і Quest 3 і дивовижний прототип Codec Avatars, який цього року випробували Марк Цукерберг і Лекс Фрідман . Це лише верхівка айсберга, і дослідницькі досягнення Reality Labs дозволять нам випустити низку перших у галузі продуктів протягом наступних років.
Але з усіх речей, які я тут згадав, найцінніші технології – це ті, які сьогодні в руках людей. Прогрес, досягнутий у 2023 році, означає, що генеративний штучний інтелект прокладає собі шлях до серця найпопулярніших програм у світі, змішана реальність тепер є основою гарнітур для масового ринку, а розумні окуляри дозволять штучному інтелекту побачити світ з нашої точки зору для перший раз. Це надзвичайно захоплюючий час для побудови майбутнього. Що ще важливіше, це чудовий час, щоб жити в ньому.