Alibaba пуска Qwen VLO, нов инструмент за генериране на изображения, за да предизвика Chatgpt-4o
Alibaba Group пусна нова разновидност на своята технология за изкуствено просветеност, която ще разреши на потребителите да генерират и трансформират изображенията от текст и визуализации. Компанията пусна Qwen VLO като част от поредност от AI услуги, предоставяни от компанията. Този нов модел е надстройка на по-ранния QWEN2.5-VL и генерира както текст към изображение, по този начин и изображение към изображение. Чрез завладяваща технология, наречена Progressive Generation, потребителите ще могат да виждат процеса като основан изображение.
В обява на X Компанията разгласи издаването на нов модел дружно с неговите функционалности и връзка за достъп до нея.
Според обявата в блога на компанията за Gitihub, Qwen Vlo е унифицирано мултимодалско схващане и генериране. Той освен „ схваща света “, само че също по този начин генерира висококачествени изображения въз основа на това схващане.
Текст-образа и генериране на изображения към изображение
посредством Qwen VLO можете непосредствено да изпратите подкана като „ генериране на фотография на куче “ или „ качване на изображение на куче “ и да поискате да извършите редактиране на изображението. Според BlogPost, предходните модели се бориха със семантични несъответствия като неправилно пояснение на автомобил като различен обект или не съумяват да запазят основни характерности на автомобила. С QWEN VLO компанията фиксира това и може вярно да разпознава основните характерности на автомобил като неговия модел, цвят и така нататък
Отворен завършек на инструкциите, основан на указания
Докато редактирането на изображение Qwen VLO ще реагира на отворени указания като прибавяне на слънце към небето или да направи фотографията да наподобява като 19 век. Той даже разрешава на потребителя да извършва обичайните задания за усещане като прогнозиране на карти на дълбочината, карти за сегментиране, карти за разкриване и информация за ръба. Той може да извършва голям брой от тези функционалности за редактиране по едно и също време.
Многоезична поддръжка за подкана
, до момента в който дава указания, потребителят ще бъде свободен да написа на няколко езика, в това число на китайски и британски език. Според компанията моделът ще разбере инструкциите, без значение от езика.
Alibaba, известно прочут със своите услуги за електронна търговия, интегрира AI и построява независими оферти към Qwen. През февруари основният изпълнителен шеф Еди Ву стигна до такава степен, че да каже, че „ главната цел “ на компанията в този момент е изкуствена обща просветеност, което значи цел за създаване на AI системи с интелектуални благоприятни условия на човешко равнище.