1. Chuyện gì đã xảy ra?
Chỉ cần nhập vài từ khóa, chỉ sau vài phút MidJourney sẽ cho ra thành phẩm nghệ thuật khiến bạn kinh ngạc. MidJourney gây ấn tượng hơn những phần mềm AI vẽ tranh khác ở chỗ các sản phẩm đầu ra có sự đa dạng trong phong cách nghệ thuật cũng như màu sắc. Các tác phẩm của MidJourney cũng sớm nhận được sự chú ý và trở thành trang bìa cho tờ The Economist.
Bạn có thể nhập vào các từ khóa miêu tả về bức tranh như: cảm xúc, tông màu, phong cách nghệ thuật, ví dụ tiêu biểu, tên nghệ sĩ,… để có thể tạo ra bức tranh hoàn chỉnh theo ý mình. Hiện tại, MidJourney vẫn đang nằm ở bảng thử nghiệm beta kín, yêu cầu phải đăng ký ở websites nếu muốn sử dụng thử.
2. Có ứng dụng nào tương tự MidJourney?
Tranh vẽ bằng trí tuệ nhân tạo thực chất không phải một điều gì quá mới mẻ. Một đại diện tiêu biểu cho lĩnh vực này phải kể tới DALL-E 2. Đây là một hệ thống trí tuệ nhân tạo được tạo ra bởi công ty OpenAI, chuyên nghiên cứu về công nghệ trí tuệ nhân tạo được thành lập từ năm 2015. Cái tên này là sự kết hợp giữa tên danh họa Salvador Dali và robot Wall-E.
DALL-E 2 có khả năng tạo ra hình ảnh thực tế và tranh ảnh nghệ thuật tới từ những mô tả văn bản của người dùng. Phiên bản này đã có sự nâng cấp so với phiên bản DALL-E ban đầu khi các hình ảnh cho ra sắc nét và có chất lượng cao hơn.
Nhiều người dùng khi trải nghiệm DALL-E 2 và MidJourney đã nhận xét rằng các tác phẩm của DALL-E 2 nhìn thực tế trong khi MidJourney lại thiên về phong cách tranh vẽ hơn. Hiện tại DALL-E 2 là một bản thử nghiệm kín chỉ được gửi cho một vài nghệ sĩ và nhà nghiên cứu.
Một phiên bản khác đang làm mưa làm gió của AI này là DALL-E mini được tạo ra bởi lập trình viên Boris Dayma nhằm tham dự cuộc thi của Google và cộng đồng AI Hugging Face. Phiên bản này không liên quan gì tới phiên bản của OpenAI.
Bên cạnh đó, Google cũng vừa thông báo công cụ mang tên Imagen. Tuy nhiên Google cho rằng công cụ này chưa phù hợp để cho cộng đồng sử dụng. Bên cạnh đó cũng có nhiều nhà phát hành nhỏ phát triển công cụ cho riêng mình. Bạn có thể tìm thấy tại đây.
3. AI học cách vẽ tranh như thế nào?
Chúng ta đã quen với việc nhập từ khóa để tìm các hình ảnh phù hợp trên mạng. Quy trình này bắt đầu từ việc chúng ta đăng hình ảnh lên và sau đó hình ảnh được gắn tag và miêu tả bằng các từ khóa. Điều này giúp máy móc “học” được các hình ảnh thực. Và hiện tại, quá trình này đã được đảo ngược khi từ những từ khóa, các hình ảnh mới, chưa từng được xuất hiện được tạo ra.
Để làm được điều này AI phải được dạy với một kho dữ liệu đa dạng và khổng lồ. Nguồn dữ liệu này có thể tới từ Internet với kho hình ảnh đi kèm với các từ ngữ miêu tả. Các dòng miêu tả này có thể là “Alt text” thường xuất hiện ở các hình ảnh trên Internet.
Bằng Deep Learning, AI không chỉ hiểu mô tả đơn giản của một sự vật, mà thay vào đó tìm ra mối liên hệ giữa các vật khác nhau. Ví dụ như vật thể “chuối” sẽ gắn liền với những từ khóa như “bữa sáng”, “màu vàng”, “khỉ,”…
Sau đó thông tin này sẽ kết hợp với đề bài người sử dụng tạo ra ban đầu để đưa ra được thành phẩm. Ở giai đoạn này, AI sẽ “khuếch đại” (diffusion) dữ liệu này sao cho hợp lý nhất có thể để tạo ra tác phẩm hoàn chỉnh, bắt đầu từ những chấm pixel nhỏ nhất. Và quá trình này sẽ được lặp đi lặp lại cho tới khi tạo ra tác phẩm hoàn chỉnh.
Quá trình khuếch đại này là hoàn toàn ngẫu nhiên nên nó sẽ tạo ra nhiều kết quả khác nhau. Tuy nhiên, các tác phẩm này có thể sẽ không hoàn chỉnh hay mờ ảo khi đôi khi việc định danh và gắn thẻ sản phẩm bị sai hay AI được đào tạo bởi những nguồn dữ liệu khác.
Ví dụ như muốn tạo ra con mèo lái ô tô, dữ liệu này sẽ tìm tất cả các hình ảnh con mèo và ô tô mà nó có được. Sau đó AI sẽ tìm ra những điểm chung của hai dữ liệu này để giúp chúng kết hợp thành một bức tranh phù hợp nhất với đề bài.
4. Vấn đề của tranh vẽ AI là gì?
Một số AI vẽ tranh như DALL-E 2 đã gặp vấn đề trong việc tạo tác phẩm mang đầy thiên kiến khi sử dụng nguồn dữ liệu từ Internet. Cụ thể hơn, một số tác phẩm thiếu sự đa dạng về văn hóa khi chủ yếu sử dụng nguồn từ văn hóa phương Tây.
Bên cạnh đó, các công cụ này cũng thường để phụ nữ là chủ thể chính trong các tác phẩm khiêu dâm hoặc tạo ra các tác phẩm có tính chất phân biệt chủng tộc. Ví dụ như khi tạo ra tác phẩm có từ khóa “Muslim” (đạo Hồi), hình ảnh đôi khi mang tính chất bạo lực. Đây chính là giới hạn của việc sử dụng nguồn dữ liệu từ mạng Internet.
Vì lý do này mà công cụ Imagen của Google cũng chưa được sử dụng công khai khi mà công ty này vẫn đang phát triển chiến thuật giúp AI của họ không bị ảnh hưởng bởi thiên kiến.
5. Liệu AI có khả năng thay thế “họa nô”?
Trong những năm gần đây tranh ảnh NFT trở nên phổ biến. Các tác phẩm này được tạo ra bằng cách kết hợp nhiều yếu tố lại để tạo ra các tác phẩm ngẫu nhiên hoàn toàn khác nhau. Đặc điểm của các tác phẩm này ở chỗ chúng đều nhìn “hao hao” nhau nhưng thực chất lại khác nhau.
Các công cụ sáng tạo AI hiện tại thì hoàn toàn khác khi có thể tạo ra những tác phẩm chung chủ đề nhưng hoàn toàn khác nhau. Điều này khiến nhiều nghệ sĩ thương mại tự hỏi liệu tương lai nghề nghiệp của họ sẽ ra sao. Vì lúc này, việc tạo ra hình ảnh bối cảnh trong game thứ tốn cả tiếng đồng hồ nay chỉ cần vài phút.
Rất nhiều người tỏ ra tích cực về tương lai của nghệ thuật với AI. Một số cho rằng chúng giúp việc tạo ra những tác phẩm mẫu, giúp việc giao tiếp với khách hàng dễ hơn. Hay cơ bản đây có thể là bước đầu tiên trong quá trình sáng tạo giúp bạn mở ra nhiều khả năng mới hơn.
Tuy nhiên thì đó là những gì chúng ta có thể nói hiện tại khi mà các sản phẩm của AI vẫn chưa có tính hoàn thiện và chính xác cao. Những tác phẩm của hiện tại vẫn dựa nhiều trên ý tưởng của con người. Tương tự, những phong cách nghệ thuật trong các tác phẩm này cũng đang dựa trên tác phẩm của những nghệ sĩ nổi tiếng. Suy cho cùng, đây vẫn là một công cụ được tạo ra bởi con người và phục vụ con người.
Bài: Minh Anh, Tổng hợp: Leo