위 포스팅에서도 한 번 다룬적이 있습니다만, 현재의 인공지능 사용법은 과도기에 가깝다고 생각합니다. 분명 더 나은 방법이 있다고 생각하기에 스터디도 하고 많은 분들의 의견을 들어보고 있는데요. 애플이 최근 재밌는 논문을 게재해 가져와 봤습니다.
Ferret-UI- Grounded Mobile UI Understanding with Multimodal LLMs.pdf1.08MB
이번에 Ferret-UI라는 모델은 공개된 모바일 UI 화면을 더 잘 이해하고, 자연어 지시에 따라 특정 UI 요소를 참조하거나 위치를 특정할 수 있는 멀티모달 대형 언어 모델(MLLM) 기반의 새로운 접근 방법 입니다. 좀 더 쉽게 말하면 사용자가 현재 보고 있는 화면을 이해하고 사용자 행동을 추측하여 더 나은 선택을 할 수 있게 돕는다는 것 입니다.
•
UI의 복잡성 극복: 현대의 모바일 앱은 다양하고 복잡한 UI로 구성되어 있으며, 사용자는 이러한 UI를 통해 정보를 얻거나 명령을 실행해야 합니다. Ferret-UI는 이러한 복잡한 UI 구조를 이해하고 사용자의 지시에 따라 정확한 UI 요소를 식별하도록 돕습니다.
•
접근성 향상: Ferret-UI는 시각적 이해에 기반하여 UI의 접근성을 크게 향상시킬 수 있습니다. 이는 특히 시각 장애가 있는 사용자들에게 앱 사용의 편의성을 제공합니다.
•
멀티스텝 UI 내비게이션 간소화: 사용자가 앱 내에서 복잡한 작업을 수행할 때, Ferret-UI는 필요한 UI 요소를 정확히 식별하고 지시할 수 있도록 지원합니다. 이를 통해 사용자는 더 효율적으로 목표를 달성할 수 있습니다.
애플의 Ferret-UI 기술은 멀티모달 대형 언어 모델을 활용하여 모바일 UI의 이해를 극대화하고, 이를 통해 사용자의 경험을 향상시키는 혁신적인 접근을 제공합니다. 이 기술은 앱의 복잡성을 극복하고, 접근성을 높이며, 앱 개발 과정의 효율성을 증가시키는 등 다방면에서 좋은 접근방법이라고 생각됩니다.
다만, 역시나 등장하는 프라이버시 보안 문제 그리고 불완전한 자동완성 기능처럼 되지 않을까?하는 걱정도 같이 있는 상태 같습니다. 애플의 경우, 모델을 공개하거나 인공지능 기술에 대한 선제적 조치보다는 자신들이 늘 잘하던 iOS, MacOS에 적절하게 녹이고 실용적으로 접근하려는 의도가 보이는 듯 합니다.
Subscribe to 'haebom'
📚 Haebom의 아카이브에 오신 걸 환영합니다. --- IT 💻, 경제 💰, 인문학 🎭을 관련 된 글을 올립니다. 제 생각과 관점 혹은 관심사가 궁금하시면 구독해주세요. haebom@kakao.com
Subscribe
haebom
해봄의 아카이브
인공지능이 뜨거운데 왜 애플은 조용한가?
Haebom
구글, 메타, MS 등 인공지능, 생성형 모델들이 뜨거운 관심을 받고 있습니다. 실제로 기존 빅테크들은 OpenAI, Anthropic과 같은 LLM을 가진 기업들과 활발한 협업을 하고 있습니다. 이 와중에 들리지 않는 이름이 Apple 입니다. 전세계에 빠와까 모두를 미치하게 하는 브랜드는 애플이 유일하다고 할 수 있을 것 같은데 그들은 이번 만큼은 조용합니다.
물론 몇 번의 찌라시 같은 기사들로 Apple GPT가 출시 될 것이다. 사실 애플은 인공지능 관심 없고 MR 쪽 몰빵이다 등 여러 이야기가 돌았습니다. 실제로 애플은 수년전 부터 AI/ML팀을 운영하며 Ajax와 같은 자체 언어 모델을 보유하고 있었으며 최근 팀 쿡 인터뷰에 따르면 내부적으로 생성 AI 기술을 활용한 제품을 이미 개발했고 외부 공개 일정을 조율하고 있다고 밝혔습니다.
실제로 최근 애플은 Matryoshka Diffusion Models의 경우, 기존의 디퓨전 모델을 활용한 이미지 생성 방법의 한계를 극복하고, 고해상도에서도 효율적인 이미지와 비디오 생성을 가능하게 하는 방법을 제안하는 내용으로 공개를 했습니다. 실제로 유효한 방법이고 1024 정방형 이미지에 한해서는 상당히 빠르고 높은 품질을 보여줍니다. 이런 움직임을 보면 애플의 이미지생성 모델, 언어모델 등에서 자체적으로 성과를 내고 있고 M1 칩 공개 때 처럼, 최적화가 완료 될 즈음에 내용을 공개하지 않을까 합니다. https://arxiv.org/abs/2310.15111
예전에 해커뉴스에 누군가 댓글을 단게 기억이 나는데 생성형 인공지능에 대해 "마음에 안들면 할루시네이션이라고 하고 마음에 드는 결과가 나오면 창의성이라 한다.(It's hallucination if you hate it, and creativity if you like it.)"라는 댓글이 인상적이였습니다. 누군가 애플의 행보를 보고 애플이 인공지능에 대해 잘 못하네라고 판단할 수도 있겠지만 늘 그래왔듯이 신중하게 움직이는 걸 수도 있습니다. PR에서도 과하지 않게 하는 걸 보면요.
애플의 오랜 팬이자 사용자로선 늘 그렇듯 실제 도움이 되고 의미 있는 결과를 보여주리라 믿습니다.