专题栏目

状态 12

Pod 5. 感知机

感知机(Perceptron)是一种基本的线性二分类模型,输入为实例的特征向量,输出为实例的类别,具体为 +1 或 -1 的二值。该模型在输入空间(特征空间)中构造一个分离超平面来区分正负两类实例,属 ...

Pod 4. 什么是强化学习?

强化学习是机器学习领域的一个分支,它专注于如何使智能系统通过与环境的交互来学习最佳行为策略。这一学习过程假设智能系统与环境的互动符合马尔可夫决策过程,其中智能系统能够观测到一系列因交互产生的状态和奖励 ...

Pod 3. 什么是无监督学习?

无监督学习是一种机器学习方法,它从未经标记的数据中发掘预测模型。这些数据是自然生成的,而预测模型用来揭示数据的分类、转换或概率分布。无监督学习的核心目标是识别出数据内部的统计规律或隐藏结构。 模型的输 ...

Pod 2. 是什么监督学习?

监督学习是机器学习的一种方法,它依靠带有标签的数据来学习预测模型。这种学习方式的核心是找到输入到输出之间的统计规律。 Pod 2.1 输入空间、特征空间和输出空间 在监督学习领域,我们将所有可能的输入 ...

Pod 1. 什么是机器学习?

机器学习,这一计算机科学的前沿领域,正在以数据为核心,通过建立统计模型来引领智能化时代的发展。本文概述了机器学习的核心特征,包括其基于计算机和网络的平台,对大量数据的深度分析能力,以及其在预测和分析方 ...

LLaMA2模型代码详解

Llama2 是 Meta 最近推出的大语言模型,它的训练数据集达到了两万亿个token。与前代产品 Llama 的 2048 的上下文长度相比,Llama2 的上下文长度扩展至 4096,使其能够理 ...

大模型基础之归一化方法

对于预训练大型语言模型,训练的不稳定性是一个挑战性的问题。为了缓解这个问题,标准化被广泛地用作稳定神经网络训练的策略。在原始的Transformer中,采用了LayerNorm。近期,有几种高级的标准 ...

从另一个角度思考交叉熵损失函数

现在让我们先抛开、,好好讲一讲。作为神经网络的最后一层的输出,的每个元素对应于每个类别的得分,其取值范围是整个实数域。我们优化神经网络的目的就在于让目标类别的得分变大,非目标的得分变小。 假设有个类别 ...

【搜索算法入门系列】一、搜索系统简介

搜索系统又称为检索系统,一个检索系统通常是指一个用于查找、检索和提取信息的系统。这种系统广泛应用于各种领域,如互联网搜索引擎、企业信息检索、数字图书馆、内容管理系统等。一个典型的检索系统主要由以下几个 ...

SelfCheckGPT: Zero-Resource Black-Box Hallucination Detection for Generative Large Language Models

生成型大型语言模型(LLM),如GPT-3,能够对各种用户提示生成高度流畅的响应。然而,众所周知,LLM会对事实产生幻觉,并做出非事实陈述,这可能会破坏对其输出的信任。现有的事实核查方法要么需要访问输 ...