BỐN NGƯỜI TRẺ THÁCH THỨC CÁC ÔNG LỚN VỚI MÔ HÌNH GIỌNG NÓI MÃ NGUỒN MỞ
HƯỚNG DẪN TẠO AVATAR TÙY CHỈNH
Một đội ngũ trẻ tuổi gồm bốn người đang thử thách các ông lớn trong ngành với mô hình chuyển giọng sang giọng mã nguồn mở đầu tiên! Hãy cùng khám phá cách Standard Intelligence sử dụng 20 triệu giờ âm thanh để tạo ra giọng nói tự nhiên và sống động hơn bao giờ hết.
BẢN TIN HÔM NAY CÓ GÌ?
Điểm tin AI: Các trung tâm dữ liệu, bộ não của robot, và mô hình mới của MIT
Cách tạo avatar tùy chỉnh giống bạn
Một đối thủ mã nguồn mở cho Chế độ Giọng nói
5 công cụ AI mới
Hình ảnh tạo bởi AI: Nghệ thuật Đá
ĐIỂM TIN AI
Nguồn: Getty Images
1. Jensen Huang, vua Đan Mạch và nhà sản xuất Ozempic Novo Nordisk có gì chung? Họ vừa hợp tác để xây dựng một trong những siêu máy tính lớn nhất thế giới — lớn hơn một sân bóng rổ. Nvidia cung cấp chip AI, Novo Nordisk cấp vốn, và Quỹ Đầu tư và Xuất khẩu Đan Mạch hỗ trợ chính trị. Đây sẽ là trung tâm nghiên cứu tiên phong trong các lĩnh vực chăm sóc sức khỏe và năng lượng xanh, mở ra tiềm năng đột phá cho tương lai.
2. Một “bộ não” robot mới chạy bằng AI có thể giúp humanoids làm việc nhà cho bạn: Với sự hỗ trợ từ Jeff Bezos và OpenAI, startup AI Physical Intelligence có trụ sở tại SF vừa huy động 400 triệu đô la để phát triển một "bộ não tổng quát có thể điều khiển bất kỳ robot nào." Dù chỉ mới ra đời cách đây tám tháng, công ty đã chứng minh phần mềm của mình có thể giúp robot thực hiện các nhiệm vụ như gấp đồ giặt và đóng gói hàng hóa.
3. Dạy một robot cũ các kỹ năng mới: Không như các mô hình LLM, hầu hết các mô hình tập trung vào robot được huấn luyện trên chỉ một bộ dữ liệu nhỏ, rất chuyên biệt, khiến chúng gặp khó khăn trong việc học các kỹ năng mới ngay lập tức. MIT đang thay đổi cách chúng ta huấn luyện robot với một kỹ thuật đột phá: thay vì chỉ dựa vào bộ dữ liệu nhỏ, họ đã đưa tất cả mọi thứ vào mô hình tùy chỉnh của mình. Kết quả là robot có thể học các kỹ năng mới và chuyển đổi giữa các nhiệm vụ một cách liền mạch, hiệu quả hơn 20% so với phương pháp truyền thống. Điều này mở ra một tiềm năng mới trong việc ứng dụng robot trong các công việc đa dạng và phức tạp.
TÀI SẢN MÀ TỶ PHÚ KHAO KHÁT SỞ HỮU - NHƯNG 67,229 NHÀ ĐẦU TƯ MỖI NGÀY ĐÃ ĐẠT ĐƯỢC ĐIỀU ĐÓ.
Khi các tài sản quý hiếm và giá trị xuất hiện trên thị trường, thông thường chỉ 1% người giàu nhất mới có thể tiếp cận những cơ hội đầu tư tuyệt vời. Tuy nhiên, điều này không còn là quy luật nữa:
Trong 7 kỳ bầu cử gần đây (từ năm 1995 đến 2023), nghệ thuật đương đại đã vượt qua chỉ số S&P 500 đến 64%, bất kể ai là người chiến thắng. Giờ đây, Masterworks đang mở ra cơ hội cho các nhà đầu tư hàng ngày tham gia vào các khoản đầu tư nghệ thuật trị giá hàng triệu đô la.
Đến nay, những nhà đầu tư này đã đạt được lợi nhuận ròng hàng năm ấn tượng, với các tỷ lệ như +17,6%, +17,8% và +21,5% (trong số các tài sản giữ lâu hơn một năm, không tính đến các tài sản chưa bán).
Với hơn 1 tỷ đô la vốn đã huy động được qua 450 đợt chào bán, cổ phiếu của Masterworks thường bán hết chỉ trong vài phút.
Tuy nhiên, với tư cách là đối tác đáng tin cậy, độc giả của Superhuman có thể nhấp vào đây để bỏ qua danh sách chờ.
Lưu ý: Hiệu suất trong quá khứ không đảm bảo lợi nhuận trong tương lai. Đầu tư luôn tiềm ẩn rủi ro.
CÁCH TẠO AVATAR TÙY CHỈNH GIỐNG BẠN VỚI HEYGEN
Hướng dẫn từng bước để tạo các avatar cá nhân hóa dựa trên hình ảnh của bạn, từ đăng ký tài khoản trên HeyGen tới tải lên hình ảnh và đào tạo mô hình để tạo ra các phiên bản avatar đa dạng. Bạn có thể dùng avatar này để tạo quảng cáo, tài liệu học tập, video và nhiều hơn thế.
Truy cập trang web của HeyGen và đăng ký để nhận điểm.
Truy cập bảng điều khiển của bạn và nhấp vào Avatar.
Bây giờ, hãy nhấp vào Ảnh đại diện và nhấp vào Tạo ảnh đại diện.
Tải ảnh đại diện của bạn lên (tải lên ảnh rõ nét, tốt nhất là ảnh toàn thân). Bạn cũng có thể sử dụng ảnh đại diện có sẵn.
Tải lên ít nhất 10 ảnh của chính bạn để có kết quả tốt nhất và nhấp vào Train model. Thao tác này sẽ mất vài phút.
Lưu ý: Tải lên nhiều ảnh hơn sẽ cho kết quả tốt hơn
Cung cấp thêm thông tin chi tiết như tuổi, người mẫu, v.v.
Sau khi hoàn tất, hãy viết bất kỳ lời nhắc nào để đưa nhân vật của bạn vào bất kỳ cảnh, trang phục và tư thế nào bạn muốn.
Sau khi tạo xong, hãy tải xuống và chia sẻ.
Sử dụng tính năng ảnh đại diện của HeyGen, bạn có thể tạo nhiều biến thể tùy thích cho nhân vật của mình một cách hoàn hảo. Bạn có thể sử dụng ảnh đại diện này để tạo quảng cáo, tài nguyên học tập, video và nhiều nội dung khác.
MỘT LỰA CHỌN MÃ NGUỒN MỞ CHO CHẾ ĐỘ GIỌNG NÓI
Source: Vecteezy/Supachai Promrit
Chúng ta có thể giao tiếp bằng ngôn ngữ mẹ đẻ mà không phải dịch từng từ, chỉ đơn giản là hiểu — vậy tại sao AI không thể làm điều tương tự? Thực tế là, hầu hết các mô hình âm thanh AI hiện nay vẫn đang phải trải qua một quá trình dài và tốn kém: từ việc chuyển giọng nói thành văn bản, đến xử lý, và sau đó tái tạo lại âm thanh. Nhưng nếu AI có thể "hiểu" như chúng ta, tiềm năng thay đổi cách thức giao tiếp này là vô cùng lớn!
Đội ngũ bốn người tại Standard Intelligence đang mở ra một kỷ nguyên mới trong công nghệ âm thanh. Với sự ra đời của Hertz-Dev, một trong những mô hình mã nguồn mở đầu tiên có khả năng chuyển giọng nói trực tiếp thành giọng nói mà không cần qua bất kỳ bước dịch nào, tiềm năng thay đổi cách chúng ta giao tiếp và tương tác với AI là vô cùng lớn.
20 triệu giờ âm thanh và một mô hình tham số 8,5B — liệu đây có phải là bước đột phá tiếp theo trong công nghệ giọng nói? Phiên bản mới này nghe chân thực và nhanh chóng như Chế độ giọng nói của OpenAI, theo các bản demo mới nhất. Điều thú vị hơn nữa, vì nó là mã nguồn mở, bạn có thể tinh chỉnh nó cho mọi mục đích, từ bản dịch trực tiếp đến phân loại. Hãy chuẩn bị chào đón phiên bản 70B sắp ra mắt!
MÔ HÌNH CHUYỂN GIỌNG NÓI THÀNH VĂN BẢN MỚI (ƯU TIÊN BỞI ~73%)
AssemblyAI vừa công bố Universal-2, mô hình Chuyển Giọng Nói Thành Văn Bản tiên tiến nhất của họ. Phiên bản mới này nổi bật với khả năng nhận diện chính xác chữ viết và tên riêng, cùng khả năng xử lý các định dạng văn bản phức tạp, mang lại những cải tiến đáng kể trong hiệu suất và độ chính xác.
Tại sao 72,9% chọn Universal-2 thay vì các lựa chọn khác:
Tăng 21% cho các ký tự chữ và số như số điện thoại, mã bưu chính, v.v.
Cải thiện 24% khả năng nhận dạng danh từ riêng (tức là tên thương hiệu và người)
Tăng 15% định dạng cho email, ngày tháng, tiền tệ, v.v.
TIN TỨC NHANH
Perplexity đã ra mắt hướng dẫn cử tri sử dụng AI trước cuộc bầu cử Hoa Kỳ. Nguồn: Perplexity
🗳️ Trong khi hầu hết các nền tảng AI đều tránh xa cuộc bầu cử Hoa Kỳ, Perplexity lại nghiêng về nó với một trung tâm hỗ trợ AI có tính năng kiểm phiếu trực tiếp, tóm tắt ứng cử viên và thông tin bỏ phiếu.
✨ Mô hình tập trung vào hiệu quả của Anthropic, Claude 3.5 Haiku, sẽ có trên API của công ty khởi nghiệp cũng như các nền tảng của bên thứ ba phổ biến như Amazon Bedrock.
🐝 Meta đã buộc phải từ bỏ kế hoạch xây dựng một trung tâm dữ liệu AI chạy bằng năng lượng hạt nhân tại Hoa Kỳ vì một loài ong quý hiếm đã được phát hiện gần địa điểm này.
🔍 Spot AI đã huy động được 31 triệu đô la cho phần mềm có thể giám sát các đối tượng trong một cảnh — hoặc giúp bạn tự động xóa các clip có liên quan thay vì tìm kiếm chúng theo cách thủ công.
📖 OpenAI đã thuê Gabor Cselle, người đồng sáng lập của một giải pháp thay thế Twitter tồn tại trong thời gian ngắn có tên là Pebble. Động thái này có thể ám chỉ sự quan tâm của OpenAI đối với một sản phẩm truyền thông xã hội trong tương lai.
5 CÔNG CỤ AI MỚI
✅ WebFill: Sử dụng AI tiên tiến để tự động điền biểu mẫu, hoàn thành khảo sát, xử lý nhập dữ liệu, v.v.
✅ Clarity: Nâng cao năng suất trong quy trình làm việc nhiều tài liệu với nền tảng AI cho phép bạn nói chuyện với tài liệu và nhận thông tin chi tiết ngay lập tức.
✅ Section School*: Section sẽ tổ chức hội nghị AI trực tuyến miễn phí vào ngày 14/11. Scott Galloway là tiêu đề, cùng với các nhà lãnh đạo AI từ Moderna, Hugging Face và ServiceNow. RSVP ngay.
✅ Heep AI: Thực hiện hành động trên WhatsApp, Instagram và Messenger, từ đặt chỗ đến quản lý đơn hàng.
✅ Fable: Thu hút khách hàng tiềm năng, chốt nhiều giao dịch hơn và đơn giản hóa quy trình tích hợp với bản demo hỗ trợ AI.
PROMPT HÔM NAY
Tổng quan tài liệu
Prompt: Hành động như một sinh viên sau đại học trong một lĩnh vực cụ thể. Bạn được giao nhiệm vụ viết bài đánh giá tài liệu cho một dự án nghiên cứu. Bài đánh giá tài liệu của bạn phải cung cấp tổng quan về nghiên cứu hiện có về một chủ đề cụ thể và xác định những khoảng trống hoặc lĩnh vực cần nghiên cứu thêm. Bài đánh giá tài liệu của bạn phải bao gồm ít nhất 10 nguồn được bình duyệt ngang hàng, được xuất bản trong vòng 5 năm qua và bạn phải đánh giá và tổng hợp một cách phê phán các nguồn này để xây dựng một lập luận mạch lạc. Bài đánh giá tài liệu của bạn phải được cấu trúc theo cách rõ ràng và hợp lý, với các tiêu đề phụ để giúp sắp xếp các ý tưởng của bạn. Ngoài ra, bạn phải cung cấp lời giải thích về phương pháp được sử dụng để tìm kiếm và lựa chọn các nguồn. Cuối cùng, bài đánh giá tài liệu của bạn phải tuân thủ các hướng dẫn về phong cách do khoa hoặc chuyên ngành của bạn đặt ra.
[Act as a graduate student in a specific field. You have been tasked with writing a literature review for a research project. Your literature review should provide an overview of the existing research on a specific topic, and identify gaps or areas where further research is needed. Your literature review should include at least 10 peer-reviewed sources, published within the last 5 years, and you should critically evaluate and synthesize these sources to build a cohesive argument. Your literature review should be structured in a clear and logical way, with subheadings to help organize your ideas. Additionally, you should provide an explanation of the methodology used to search for and select sources. Finally, your literature review should adhere to the style guidelines set forth by your department or discipline.]
=>> Bạn có thể điều chỉnh lời nhắc theo nhu cầu cụ thể của mình. Hoặc thậm chí thêm ngữ cảnh, ví dụ như:
Đây là ngữ cảnh: Bạn là sinh viên sau đại học chuyên ngành tâm lý học và dự án nghiên cứu của bạn là về tác động của mạng xã hội đến sức khỏe tâm thần của thanh thiếu niên.
HÌNH ẢNH TẠO BỞI AI
Nghệ thuật Đá
Midjourney Prompt: biểu đồ "thiết kế của con người" được làm bằng đá với tông màu xám, tro và vàng nhạt. đơn giản nhưng có cấu trúc rõ ràng --ar 9:16 --v 6.1 --stylize 250
["human design" chart graph made in stone in shades of gray and ash and pastel yellow. simple but with visible structure --ar 9:16 --v 6.1 --stylize 250]
KẾT LUẬN
Bài viết này chỉ là khởi đầu của hành trình khám phá những tiềm năng vô hạn mà công nghệ AI mang lại.
Nếu bạn thấy thông tin này thú vị, đừng ngần ngại chia sẻ với bạn bè và đồng nghiệp để cùng nhau theo dõi những bước đột phá tiếp theo. Cùng chúng tôi khám phá những xu hướng AI sẽ định hình tương lai!