Heboh! Induk TikTok Sedang Kumpulkan Data Besar-besaran, Ada Apa?

China – Bytdance, sebuah perusahaan induk Tikok yang berbasis di Cina, tampaknya mengejar generasi intelijen generasi buatan (AI).

Menurut penelitian Kasada, sebuah perusahaan yang berspesialisasi dalam manajemen bot, mereka baru saja memperkenalkan crawler internet atau bot yang menggaruk -garuk kepala mereka, yang disebut Bytespider pada bulan April 2024. Keberadaan bot ini juga dikonfirmasi oleh pengunjung kulit hitam yang memantau kegiatan bot Suchaber.

Bytespider: Goresan paling agresif di internet menunjukkan bahwa Bytespider dengan cepat menjadi salah satu pencakar paling agresif di internet. Mesin mengumpulkan data dengan kecepatan di luar perusahaan besar lainnya seperti Google, Meta, Amazon, OpenAai dan Anthropic. Scratch -Bots juga menggunakan bahasa besar atau pola multimodal (LLM/LMM).

“Dia telah mengumpulkan data sejak Bytespider, dia telah mengumpulkan data dengan kecepatan sekitar 25 -x GPTBOT, yang mengumpulkan data untuk platform ChatGPT OpenI dan model dasarnya,” kata Sam Crowther, CEO dari Kasada.

Bytespider juga mengumpulkan data dengan kecepatan 3.000 kali Claudebot (antropik), yang mengoperasikan platform Claude.

Aktivitas memo meningkat menurut Kasada, dan Bytespider menjadi semakin agresif saat mengumpulkan data. Data menunjukkan peningkatan besar dalam aktivitas awal bytespider dalam enam minggu terakhir.

ScrapingWeb -scraping -web -web -Contro -Contro telah ada selama beberapa dekade, terutama mesin pencari untuk mengumpulkan tautan ke situs web. Namun, kenaikan perangkat AI generatif menambahkan dimensi baru dan membuat praktik ini ke sumber persidangan dan konflik.

Individu dan organisasi yang pekerjaannya berpendapat bahwa hak cipta mereka dilanggar dalam proses ini.

Semua model di mana alat AI generatif didasarkan pada dilatih dengan sejumlah besar data online, yang pada dasarnya semuanya tersedia di internet, khususnya informasi tertulis. Perusahaan teknologi menggunakan seluruh bot untuk menyalin semua ini gratis dan memasukkannya ke dalam file data.

Bytdance mengikuti keterlambatan tahun lalu bahwa Bytdance dilaporkan sangat diikuti oleh ras AI generatif, sehingga Anda dapat menggunakan OpenAi untuk membangun Bytdance -LLM Anda sendiri, yang bertentangan dengan ketentuan layanan Openai.

Awal tahun ini, Bytdance menerbitkan obrolan berbasis LLM yang disebut Duabo, tetapi pengembangan model dikumpulkan sebelum mengumpulkan data pelatihan terbaru di Bytespider.

Fungsi pencarian LLM dan Tikkok sesuai dengan sumber internal perusahaan mengembangkan LLM baru. Salah satu tujuannya adalah untuk meningkatkan fungsi pencarian Tiktok.

Pekan lalu, Tiktok merilis pembaruan untuk fungsi pencariannya, dengan fokus pada kata kunci untuk iklan, dan iklan itu pada dasarnya dapat mencari kata -kata yang cenderung waktu nyata di Tikkok.

Dengan cara ini, pasar iklan dapat membuat kata kunci yang relevan yang harus mendukung tampilan di layar pengguna lain.

Model dan data baru AI tentang tren dan topik web terbaru dapat memperluas dan meningkatkan lingkungan untuk lingkungan.

“Mengingat audiens dan jumlah alasan, Tiktok dan lingkungan pencarian yang benar -benar dinegosiasikan dengan kata kunci dan topik, itu akan sangat menarik bagi banyak orang yang menghabiskan banyak anggaran dengan Google Today,” telah menulis sumber daya.

CATEGORIES:

Teknologi

Comments are closed

Latest Comments

No comments to show.
PAY4D gbk99