Apple впроваджує комп’ютерний зір у майбутні AI-пристрої
Apple, схоже, поступово рухається в напрямку створення гаджетів з штучним інтелектом, і якщо вірити нещодавньому звіту Bloomberg, багато з них матимуть одну спільну рису: вони використовуватимуть «візуальний інтелект». Якщо ви не в курсі брендингу Apple, «візуальний інтелект» — це версія комп’ютерного зору від компанії, тобто функція штучного інтелекту, яка надає гаджетам «зір», так би мовити.
За даними Bloomberg, Apple хоче, щоб Visual Intelligence стала визначальною функцією для цілого ряду пристроїв, включаючи нове покоління AirPods з камерами, першу пару смарт-окулярів Apple і навіть AI-кулон, який дивно нагадує невдалий Ai Pin від Humane. Що саме буде робити комп’ютерне бачення в цих гаджетах? Ну, мабуть, те саме, що і в інших гаджетах. За даними Bloomberg:
«… найпростіші застосування можуть полягати в тому, щоб взяти тарілку з їжею та ідентифікувати продукти та інгредієнти. Більш просунуті застосування включають надання пристроєм конкретних інструкцій для виконання завдання на основі того, що він бачить. Це може означати вдосконалені покрокові вказівки, коли пристрій каже користувачеві пройти повз певну орієнтирну точку, а не просто певну кількість метрів. Технологія також може нагадувати користувачам про те, що вони повинні зробити, коли підходять до певного об’єкта або місця».
Якщо ви хоч трохи знайомі з комп’ютерним зором і тим, як він працює в таких гаджетах, як смарт-окуляри, то, ймовірно, прочитавши вищезазначене, ви відчули дежавю. Комп’ютерний зір є визначальною особливістю популярних смарт-окулярів, таких як Ray-Ban Meta AI, і може використовуватися для багатьох речей, наприклад, для перекладу тексту в меню, ідентифікації об’єктів у вашому оточенні та надання інструкцій щодо рецепта під час приготування їжі. Хоча я визнаю, що використання навігації буде новим, Apple, здається, йде тим самим шляхом, що й Meta та інші компанії, які вбудовують можливості комп’ютерного зору в своє обладнання.
Чи буде Apple більш успішною у впровадженні комп’ютерного зору — тобто візуальної інтелігенції — в гаджети з штучним інтелектом, ніхто не знає. Хоча комп’ютерний зір, безперечно, є однією з найбільш футуристичних і нових функцій смарт-окулярів, він також є одним з найменш надійних і, часто, найменш придатних для щоденного використання. З мого досвіду використання окулярів Ray-Ban Meta AI, комп’ютерне бачення має звичку помилятися (ви можете прочитати мою рецензію на Meta Ray-Ban Display, щоб ознайомитися з конкретними прикладами), що ускладнює довіру до нього і, як наслідок, ще більше ускладнює його використання в повсякденному житті. Я все ще вважаю, що ця технологія може бути чудовою для цілей доступності, але це не зовсім те, що Apple пропонує тут.
Хоча існує ймовірність, що Apple працює над якимось проривом у галузі комп’ютерного зору, який зробить Visual Intelligence більш надійним і корисним, поки що компанія не продемонструвала жодних значних успіхів. Як зазначає Bloomberg, існуючі функції Visual Intelligence в iOS, наприклад, в основному покладаються на ChatGPT від OpenAI, а в найближчому майбутньому — на Gemini від Google. На мою думку, моделі, пропоновані цими компаніями, є такими ж недосконалими, як і решта.
До того часу, як Apple нарешті вирішить розпочати випуск свого обладнання, орієнтованого на штучний інтелект (найраніше наприкінці цього року), може статися багато чого, але на даний момент здається, що гаджети зі штучним інтелектом трохи застрягли на тому, як і коли можна використовувати комп’ютерний зір, або, принаймні, на тому, щоб зробити ці сценарії функціональними. Бачення Apple щодо візуальної інтелігенції може здаватися трохи кориснішим, ніж повідомлення OpenAI про розумну колонку з камерою, але це досить низька планка.
Источник: itechua.com