MidJourney – AI vẽ hình của Leap Motion

MidJourney là một AI chuyển văn bản thành hình ảnh giống như DALL·E, với chuyên môn về hình ảnh ‘đẹp’. Bạn sử dụng nó bằng cách nhắn tin cho bot trong ứng dụng trò chuyện, Discord. Bạn có thể dùng thử miễn phí hoặc tính phí $10/tháng cho gói cơ bản.

MidJourney là gì?

Cũng giống như DALL·E 2 hoặc Craiyon (trước đây là DALL·E Mini), MidJourney là AI chuyển văn bản thành hình ảnh tạo ra hình ảnh tuyệt đẹp dựa trên lời nhắc văn bản của bạn.

Trong khi DALL·E được thiết kế để tạo ra bất kỳ thứ gì bạn có thể tưởng tượng – bao gồm cả những thứ trần tục hoặc xấu xí – Midjourney có xu hướng tạo ra những hình ảnh đẹp mắt về mặt thẩm mỹ một cách mặc định. MidJourney thường tạo ra những hình ảnh có nhiều sắc màu, sử dụng ánh sáng và bóng tối một cách nghệ thuật, các chi tiết sắc nét và bố cục cân đối hoặc phối cảnh đẹp mắt.

Theo lời của người sáng lập, “chúng tôi chỉ muốn nó dễ sử dụng – và chúng tôi muốn những bức ảnh trông thật đẹp.”

Vậy “nghệ sỹ này” hoạt động như thế nào? Mô hình lõi của MidJourney là Stable Diffusion, nếu như bạn quan tâm đến các khía cạnh kỹ thuật.

Cách dùng MidJourney?

Không giống như DALL·E 2 hoặc DALL·E Mini, Midjourney không hoạt động trên web. Cũng không yêu cầu khả năng lập trình. Nhưng nó yêu cầu … một tài khoản Discord.

Bạn có thể tham gia Discord của trituenhantao.io tại đây.

Trên Discord, bằng cách nói chuyện với bot (Discord, đối với những người chưa từng dùng, nó giống với Zalo, bạn có thể dùng trên web, điện thoại hay máy tính), bạn sẽ ra lệnh cho bot sẽ các hình ảnh theo lời nhắc.

Là người dùng miễn phí, bạn tương tác với bot trong một phòng trò chuyện công cộng, nơi những người khác CŨNG làm điều tương tự, nó khá là hỗn loạn.

A timelapse of users prompting the bot in the public channel.

Tuy nhiên, đó cũng là một cách khá thú vị để bắt đầu: bạn có thể xem lời nhắc chính xác mà mọi người khác đang thử – và kết quả của họ – trực tiếp và chưa được lọc!

Khi bạn trở thành người dùng trả phí (chỉ từ 10 đô la một tháng), bạn sẽ có thể gửi tin nhắn trực tiếp cho bot trong một cuộc trò chuyện riêng tư, giúp mang lại trải nghiệm “bình yên” hơn nhiều. (Bạn vẫn có thể theo dõi các kênh công cộng để xem những gì đang diễn ra).

Việc tạo hình ảnh bao gồm việc nhập một câu và xem điều gì sẽ xảy ra.

Quá trình tạo hình ảnh mất nhiều thời gian hơn khoảng 2 lần so với DALL·E – mất khoảng 50 giây để hiển thị hình thu nhỏ ban đầu.

Tuy nhiên, không giống như DALL·E, bạn có thể xem AI dần dần tạo hình ảnh của bạn, từ màu mờ ban đầu đến hình thu nhỏ có độ phân giải cao.

Bạn sẽ nhận được 4 ảnh nhỏ có kích thước 256px, nếu thích, bạn có thể chọn và yêu cầu vẽ chi tiết hình ảnh mình thích với chất lượng đầy đủ.

Quá trình nâng cấp này mất thêm một phút hoặc lâu hơn để hoàn thành – bạn cũng sẽ có thể xem quá trình này diễn ra khi Midjourney vẽ các thông tin chi tiết.

Cũng giống như DALL·E, bạn cũng có thể tạo ‘các biến thể’ của bất kỳ hình ảnh nào mà bạn muốn.

MidJourney tạo ra hình ảnh trông như thế nào?

Trước đây, Midjourney thường gắn liền với một loại hình ảnh nhất định – những bức ảnh nghệ thuật fractal được trang trí công phu.

Midjourney không tạo ra các hình ảnh thường nhật mà tạo ra các hình ảnh mang tính nghệ thuật cao. Do đó, nó tạo ra rào cản cho các mục đích xấu như Deep Fake.

Tất cả hình ảnh trên được tạo bởi Midjourney, có nguồn gốc từ thư viện cộng đồng: phishnchips, richardhendricks, RankSquid, urens, Danger

Đặc biệt, xu hướng tạo ra hình ảnh cực kỳ sắc nét của Midjourney làm tăng thêm cảm giác chân thực tổng thể.

Hoạt động dựa trên lời nhắc, Midjourney hiểu tất cả các biệt ngữ kỹ thuật chụp ảnh mà bạn mong đợi. Ngoài ra bạn có thể tham khảo thêm sách hướng dẫn để tạo ra các lời nhắc xịn xò hơn.

Macro, microscopy (by NoMastersNoRulers)

Quy tắc và giới hạn nội dung

Mặc dù vẫn loại trừ hình ảnh người lớn có nội dung bạo lực và tình dục đẫm máu, nhưng Midjourney có ít giới hạn nội dung hơn nhiều so với DALL·E. Không có quy tắc nào cấm tạo hình ảnh mô tả ‘bạo lực’ một cách rộng rãi hoặc kỳ quái, bệnh tật, nội dung chính trị hoặc mô tả các nhân vật của công chúng.

Dưới đây là một số ví dụ về hình ảnh sẽ bị DALL·E chặn:


‘Gun’ (bạo lực), ‘coronavirus’ (sức khỏe), ‘Trump’ (chính trị) and ‘Taylor Swift’ (nhân vật công chúng) tất cả đều đi ngược lại chính sách nội dung của DALL·E.

Vì vậy, nếu bạn đang cố gắng thiết kế các siêu chiến binh khoa học viễn tưởng, tạo tác phẩm minh họa đi kèm với nội dung sức khỏe, thiết kế hình ảnh chính trị mạnh mẽ hoặc chỉ tạo một số tác phẩm nghệ thuật cổ điển đẹp mắt của người hâm mộ, bạn sẽ muốn chọn MidJourney .

Mọi thứ đều được lưu và công khai

Theo mặc định, MidJourney lưu mọi hình thu nhỏ và HD trong kho lưu trữ cá nhân của riêng bạn, nơi bạn cũng có thể tìm kiếm theo lời nhắc.

Kho cá nhân.

Một nhược điểm tiềm ẩn đối với những người quan tâm đến quyền riêng tư: theo mặc định, mọi lời nhắc và ảnh sinh đều được công khai, được chia sẻ trong một thư viện lớn. (Hiện tại, chỉ những thành viên trả phí mới có thể duyệt nội dung này.) Và tất nhiên, nếu bạn là người dùng miễn phí/dùng thử, bạn sẽ trực tiếp đăng lời nhắc của mình trong một phòng trò chuyện công khai. Nếu bạn đang làm việc trong một dự án thương mại, để giữ các tác phẩm bí mật, bạn sẽ phải trả $50/tháng.

Xem các tác phẩm về “strawberry” trên kho lớn.

Tuy nhiên, lợi ích của việc được tham khảo kho lưu trữ khổng lồ là rất lớn: đó là cách tốt nhất để tìm hiểu các phong cách hiện có và liên tục tìm ra những ý tưởng mới.

Trên đây là những điểm chính mà một người dùng phổ thông, không biết lập trình có thể sử dụng MidJourney, nếu bạn quan tâm đến các khía cạnh kỹ thuật, hãy đọc Minh họa Stable Diffusion. Hãy chia sẻ bài viết nếu bạn thấy nó thú vị và tham gia Discord của trituenhantao.io để cùng vọc MidJourney nhé!

Nếu bạn muốn vẽ và chia sẻ công khai, hãy gõ /imagine … trong #giao-lưu-kết-nối (Nhớ click Accept ToS để đồng ý điều khoản). Nếu không muốn chia sẻ cho nhiều người, hãy vào #chung và gõ /imagine … Các bức ảnh bạn tạo chỉ mình bạn và những người đang chat với bạn nhìn thấy. Sau khi thoát ra, mọi tin nhắn sẽ tự động được ẩn đi. Hãy thoải mái sáng tạo và nhớ lưu hình về trước khi thoát nhé!

Cách vẽ hình trên Discord của trituenhantao.io