Ao Zhang's Blog

Thinking will not overcome fear but action will.

0710算法 - 字符串01

344.反转字符串 | 541. 反转字符串II | 54.替换数字

前言 一组比较基础的字符串类型题目 344. 反转字符串 编写一个函数,其作用是将输入的字符串反转过来。输入字符串以字符数组 s 的形式给出。 不要给另外的数组分配额外的空间,你必须 原地 修改输入数组 、使用 O(1) 的额外空间解决这一问题。 思路 reverse函数的内部实现 reverse(s.begin(),s.end()); 拓展知识 字符串类 strin...

0709算法 - 哈希表02

454.四数相加II | 383. 赎金信 | 15. 三数之和 | 18. 四数之和

前言 展示了哈希法在处理 问题约束较多、记录信息较多 这一类问题下的局限性。 454. 四数相加 II 给你四个整数数组 nums1、nums2、nums3 和 nums4 ,数组长度都是 n ,请你计算有多少个元组 (i, j, k, l) 能满足: 0 <= i, j, k, l < n nums1[i] + nums2[j] + nums3[k] + nu...

强化学习中各个函数的定义及其对比

奖励函数 | 损失函数 | 优势函数| 目标函数

A loss function is a part of a cost function which is a type of an objective function. 概念关系 奖励函数(Reward Function): 定义:环境提供的反馈信号,用于评价代理在某一时刻采取的动作的好坏。 作用:指导代理学习,使其能够最大化累积奖励。...

0708算法 - 哈希表01

242.字母异位词 | 349.数组交集 | 202.快乐数| 1.两数之和

前言 当遇到需要快速判断一个元素是否在集合里出现的时候,就要考虑使用哈希表! 常见的哈希表分为三种: 数组:可以将数组下标看作是Key,而下标直接访问的数组元素就是Value; 定义:int record[26] = {0}; 大小受限,天生契合字母查找问题(最多26/52个元素) 集合(set):最常用...

Git 代码回滚

回滚代码的操作记录

git revert 和 git reset 的区别 sourceTree 中 revert 译为提交回滚,作用为忽略你指定的版本,然后提交一个新的版本。新的版本中已近删除了你所指定的版本。 reset 为 重置到这次提交,将内容重置到指定的版本。git reset 命令后面是需要加2种参数的:–-hard 和 –-soft。这条命令默认情况下是 -–soft。 执行上述命令时,这该条...

Git指令整理

一些常用的 Git 指令记录

日常使用中涉及到的Git指令整理 GitHub创建仓库提示代码 echo "# 项目名" >> README.md git init git add README.md git commit -m "first commit" git remote add origin git@github.com:qiubaiying/项目名.git git push -u ori...

强化学习与监督学习、无监督学习的区别

有无标签 & 有无反馈 & 有无对错之分

监督学习 使用带标签的训练数据来学习一个模型,然后进行预测。 事先知道训练数据中每一个样本的输出结果 常见的回归和分类任务算法都是监督学习的范畴 例如对猫和狗的图片进行预测,label = cat or dog 无监督学习 在没有标签的数据上进行学习,通过数据之间的内在联系将他们分成若干类 常见的无监督学习方法是 K-means 和 聚类 例如观看大量恐龙和...

机器学习(一) - 知识总结

激活函数及常见机器学习算法

机器学习的主要任务 分类和回归属于监督学习,之所以称之为监督学习,是因为这类算法必须知道预测什么,即目标变量的分类信息。与监督学习相对应的是无监督学习,其目标是从未标记的数据中发现隐藏的结构或模式。此时数据没有类别信息,也不会给定目标值。在无监督学习中,将数据集合分成由类似的对象组成的多个类的过程被称为聚类;将寻找描述数据统计值的过程称之为密度估计。 激活函数 Sigmoid 激活函数...