Generative AI가 전화 시장을 재충전할 수 있을까요? - 세미위키

Generative AI가 전화 시장을 재충전할 수 있을까요? – 세미위키

소스 노드 : 2926005

스마트폰 시장에 대한 합의는 소폭 하락과 소폭 성장 사이 어딘가에서 맴돌고 있으며, 이는 보다 탄탄한 성장을 위한 확실한 동인이 부족함을 나타냅니다. 비즈니스 기회로서 이 매력적이지 않은 상태는 엄청난 양(한 출처에 따르면 500년에 2023억 달러)으로 인해 다소 상쇄되지만 이미 중국 이외의 지역에서는 채택이 정점에 가까워졌으므로 휴대폰 제조업체의 실제 질문은 "다음 킬러는 무엇인가"일 것입니다. 바늘을 움직일 수 있는 앱이요?”

Generative AI가 전화 시장을 충전할 수 있습니까?

우리 소비자들은 변덕스럽습니다. 그리고 엔터테인먼트는 우리의 필수품 목록에서 높은 순위를 차지하는 것 같습니다. 팔은 모바일 게임에 베팅하기. 또 다른 가능성은 이미지 생성/조작을 위한 생성 AI일 수 있습니다. 퀄컴 이미 전화 기반 기능을 시연했습니다. Apple을 포함한 다른 회사들은 여전히 ​​대규모 언어 모델 앱에 중점을 두고 있습니다. 나에게는 생성 AI의 이미지 측면을 자세히 살펴보고 이것이 시작될 경우 좀 더 많은 지식을 얻을 가치가 있습니다. 재미삼아 Microsoft Bing의 Image Creator를 사용하여 여기에서 이미지를 생성했습니다.

확산 기반 생성

LLM과 비교하여 개념을 설명하려고 합니다. LLM은 반드시 선형인 텍스트 시퀀스를 학습합니다. 많이. 그리고 그들은 토큰화된 텍스트에 대해 작업하면서 일반적으로 해당 시퀀스를 따를 수 있는 특정 토큰 시퀀스를 볼 때 학습합니다. 텍스트에는 적합하지만 2D이고 일반적으로 토큰화할 수 없는 이미지에는 적합하지 않으므로 학습 접근 방식이 달라야 합니다. 확산 기반 훈련에서는 첫 번째 노이즈가 훈련 이미지에 점진적으로 추가되는 반면(순방향 확산), 수정된 이미지 이미지에서 노이즈를 제거하여 각 원본 이미지를 복구함으로써 네트워크가 훈련됩니다(역확산). 지저분하게 들리지만 분명히 노이즈 제거 방법(확률적 미분 방정식 풀기)은 잘 정의되어 있고 강력합니다. 일례로 안정 확산 모델(Stable Diffusion model)이 공개적으로 이용 가능합니다.

그런 다음 무작위 노이즈 이미지에서 시작하여 이 훈련된 네트워크에서 새로운 이미지를 생성할 수 있습니다. 이제 생성하려는 이미지를 안내하는 방법이 필요합니다. Dall.E-2, Midjourney 및 Stable Diffusion은 모두 텍스트 프롬프트를 사용할 수 있습니다. 이는 훈련 이미지와 함께 제공되는 텍스트 레이블에서 얻은 훈련에 따라 달라집니다. 그러면 추론에는 최종 이미지를 추론하는 과정에서 주의 과정에 대한 즉각적인 정보가 포함됩니다. LLM과 마찬가지로 이러한 시스템도 변환기를 사용합니다. 이는 이 기능을 지원하려면 새로운 하드웨어가 필요함을 의미합니다.

생성은 처음부터 이미지를 만드는 것에만 국한되지 않습니다. 라는 기술 그림 그리기 이미지의 일부를 개선하거나 교체하는 데 사용할 수 있습니다. 스마트폰에서 이미 인기를 끌고 있는 이미지 편집의 AI 기반 버전이라고 생각하시면 됩니다. 기본 색상, 조명 균형, 광폭 자르기 등뿐만 아니라 훨씬 더 어려운 문제를 해결하거나 코스프레 의상을 다시 입는 등 무엇이든 가능합니다. 이제 보니 인기가 많네요.

생성 AI가 바늘을 움직일 것인가?

잘 모르겠습니다. 변덕스러운 소비자에 대한 위의 의견을 참조하세요. 그리고 시각적 자극, 특히 우리 주변의 놀이는 거의 모든 사람에게 매력적입니다. 휴대폰에서 이 작업을 수행할 수 있다면 왜 안 되겠습니까? AI는 큰 베팅을 장려하는 것처럼 보이는 빠르게 움직이는 영역입니다. 나는 확실히 이러한 가능성에 대해 내기를 걸고 싶지 않습니다.

또한 생성 이미징은 이미 더 심각한 응용 분야를 갖고 있으며, 특히 의료 분야에서 시끄러운 CAT 스캔을 복구하거나 뼈 구조에 의해 잠재적으로 차단된 세부 사항을 복구하는 데 사용할 수 있다는 점을 언급하고 싶습니다. 나는 이 기술이 법의학 툴킷에 적용되는 것을 상상할 수도 있습니다. 우리는 모두 TV 쇼에서 본 적이 있습니다. Abby나 Angela는 눈에 보이는 것에서 훈련된 데이터를 추론하여 사진에서 누락된 세부 사항을 채웁니다. 생성 이미징이 이를 가능하게 할 수 있습니다!

다음을 통해이 게시물 공유 :

타임 스탬프 :

더보기 세미위키