DeepSeek регистрира патент за по-интелигентно и по-ефективно събиране на данни с изкуствен интелект · TechNode
Свързаната с DeepSeek Hangzhou DeepSeek AI Fundamental Technology Research Co., Ltd. днес подаде патент за нова система за събиране на уеб данни, предназначена да подобри ефективността и качеството на данните. Патентът очертава метод за откриване на повече връзки към уеб страници, като същевременно минимизира въздействието върху трафика на уебсайта. Той оценява изтегленото съдържание, за да предвиди качеството на неоткритите връзки, като дава приоритет на данни с висока стойност и намалява излишните изтегляния. Ефективното събиране на уеб данни е от решаващо значение за обучението на големи езикови модели (LLM), които захранват AI системи като ChatGPT. Съществуващите техники се борят с непълно извличане на връзки, прекомерни изтегляния, които могат да сринат уебсайтове, и филтриране на данни с ниско качество. Предложената от DeepSeek система има за цел да реши тези проблеми чрез оптимизиране на разпределението на данни и поддържане на точността на метаданните. [iThome, in Chinese]
Свързани
Нашия източник е Българо-Китайска Търговско-промишлена палaта


