我参加美国名校科研,我入读加州伯克利分校

0

【升学喜报】

热烈祝贺子童同学收到

加州大学伯克利分校文理学院

录取通知书!

恭喜子童,继续努力实现自己的梦想!

本文作者肖子童同学,品学兼优,非常热爱计算机科学,他希望能在大学申请季,顺利进入加州伯克利大学学习更多有关计算机科学或者相关领域。为此,参与了美国名校科研,增加学术背景,开拓视野,获得真知。

就在此时此刻,我们恭喜我们的子童同学——

热烈祝贺子童同学收到加州大学伯克利分校文理学院

录取通知书

恭喜子童,继续努力实现自己的梦想

本文是子童同学在加州大学伯克利分校夏季科研报告总结。

注:中文译文是编辑进行的整理,仅供部分学生及家长参考。建议英语能力较好的学生和家长建议直接阅读英文。

University of California Berkeley Summer Research 

Final Report

My name is Zitong Xiao, a Senior at Oaks ChristianHigh school. This summer, I participated in a research program focusing on big data analysis and computer science at the University of California Berkeley. I decided to participate in this program because UC Berkeley is my favorite college and computer science is my favorite subject. In the following college application season, I hope to get in to Berkeley to study computer science or related area.

我叫肖子童,是Oaks ChristianHigh 的一名高年级学生。今年夏天,我参加了加州大学伯克利分校(UniversityofCalifornia Berkeley)关于大数据分析和计算机科学的研究项目。我之所以决定参加这个项目,是因为加州大学伯克利分校是我最喜欢的大学,而计算机科学是我最喜欢的科目。在接下来的大学申请季节,我希望能进入伯克利大学学习计算机科学或相关领域。

Before coming to the program, I had only learned one year of computer science in java at my high school so because of my lack of experience on the computer science, I felt that tshis program would be really challenged. Being perturbed, I started my journey at Berkeley.

在参加这个项目之前,我在高中的计算机科学领域只学了一年的 Java,所以由于我缺乏计算机科学方面的经验,我觉得 Tshis 程序会受到真正的挑战。因此感到不安,就从伯克利开始了我的旅程。

This research project was based on a Zillow competition on the Kaggle website, a website hosting various data science competitions. Our goal was to clean and analyze the U.S. household selling price data from 2016 and build models to predict the prices and their trends in 2017. The project lasted for about one month, from July 17th to August 16th.

这一研究项目是以Kaggle网站上的Zillow竞赛为基础的,该网站举办了各种数据科学竞赛。我们的目标是清理和分析2016年美国家庭销售价格数据,并建立预测2017年价格及其趋势的模型。该项目从7月17日到8月16日,持续了大约一个月。

In my group, there were two other students also currently studying at U.S. high school. They were very friendly and easygoing. Each of us analyzed the data and built the model independently, but we shared our thoughts and approaches frequently. Our group and Dr. Lan,who was out mentor for the entire research, met twice a week at Kresge Engineering Library. All the meetings were like small group discussions. Dr. Lanstarted from giving us a background knowledge of our project, setting up the required computer language environment and packages, and teaching us the basic concepts that the computer used to perform machine learning and build various models.

在我的小组中,还有另外两名学生目前也在美国高中学习。他们非常友好和随和。我们每个人都对数据进行了分析,并独立地建立了模型,但是我们经常分享我们的想法和方法。我们小组和整个研究的导师Lan博士,会每周在Kresge工程图书馆见两次面。所有的会议都像小组讨论一样。 Lanstarted 博士从给我们一个项目的背景知识开始,建立必要的计算机语言环境和软件包,并教我们计算机是用来进行机器学习和建立各种模型的基本概念。

Then, we would have discussions on our progress of the project, including our understandings of the data,methods of cleaning the data and optimizing our models. Dr. Lan evaluated each one’s work and provided corresponding suggestions. After each meeting, we had homework on topics covered by that day’s lecture. Since the time of the meetings was limited, we would have to learn the computer programming language for this research, Python, by our own, but Dr. Lan always gave us help when we have programming difficulties during the regular meetings or office hours.

然后,我们将讨论我们的项目进展,包括我们对数据的理解,清理数据和优化我们的模型的方法。Lan 博士对每个人的工作进行了评估,并提出了相应的建议。每次会议结束后,我们都要就当天的讲座所涉及的主题做家庭作业。由于会议时间有限,我们自己必须项研究学习计算机编程语言,Python,但当我们有编程困难时,Lan 博士总是在定期的会议或办公时间帮助我们。

Throughout the entire research, I faced great challenges on a lot of aspects just like what I had expected before coming to Berkeley. The first difficulty jumped to me was to learn and master a brand-new programming language. Following Dr. Lan’s advice, I took online courses on Data Camp about Python and would be able to understand it quickly. However, when it came to be using Python in our project for specific tasks like performing machine learning, tuning parameters, printing and reading data, as well as constructing the models, I was still lost in how to write the corresponding codes to achieve those goals.

在整个研究过程中,我在很多方面都面临着巨大的挑战,就像我来到伯克利之前所想的那样。我遇到的第一个困难是学习和掌握一门全新的编程语言。按照 Lan 博士的建议,我参加了有关Python的数据营的在线课程,并且能够很快地理解它。然而,当它在我们的项目中使用Python来执行特定的任务时,比如执行机器学习、调整参数、打印和读取数据以及构造模型,我仍然不知道如何编写相应的代码来实现这些目标。

The second challenge part was how to read, analyze, and clean a giant data sets. The household selling price data includes almost three million different households identified by the number and their corresponding 68 features. Within the data, there were categorical and quantitative variables. Most frustratingly, there were a lot of missing data on some of the houses’ features. For our program, the computer was not able to process the data with invalid values so we have to make choices on deleting them or filling them out with some appropriate values based on the real-life situations.

第二个挑战的部分是如何读取、分析和清理一个巨大的数据集。家庭销售价格数据包括近三百万个不同家庭的数量和相应的68个特征。在数据中,有分类变量和定量变量。最令人沮丧的是,关于这些房子的一些特色,有很多缺失的数据。对于我们的程序,计算机无法处理无效值的数据,所以我们必须根据实际情况选择删除它们或用适当的值填充它们。

All of those knowledge came from the study of statistics, but I had not taken any statistics class at that point. Finally, after finishing all the data cleaning, I thought I was able to have a low predicting error, but once again I was wrong. My result was even worse than the result using the raw data. I spent a long time trying to analyze why this happened. As a result, I realized that those invalid data needed to be handled in more advanced ways which was beyond the scope of this research.

所有这些知识都来自统计学的研究,但那时我还没有上过统计学课。最后,在完成了所有的数据清理后,我认为我可以有一个较低的预测误差,但我再次错了。我的结果甚至比使用原始数据的结果还要糟糕。我花了很长时间来分析为什么会这样。因此,我意识到,这些无效的数据需要用更先进的方式处理,这超出了本研究的范围。

My last difficulty was on the conceptual knowledge that Dr. Lan taught us during the meetings. Those knowledge included machine learning and mathematical equations derived to approximate the outputs with the given inputs. Many of those knowledge requires a really strong mathematical background to understand how they work.

我最后的困难是 Lan 博士在会议上教我们的概念知识。这些知识包括机器学习和用给定输入近似输出的数理方程。这些知识中有很多都需要有很强的数学背景才能理解它们是如何工作的。

However, as a high school senior, the furthest math course I had gone to was only single variable calculus which was not sufficient to the knowledge and concepts of this program. Fortunately, those concepts were just supplements helping us understand the theory of data science, not required for us to build our models because computer can handle those calculations and equations for us. Although I had faced a lot of challenges throughout the research, I was mostly enjoying participating in it since it was closely related to our daily life and my future study and job experience.

然而,作为一名高中生,我上过的最远的数学课程仅仅是单变量微积分,对这个程序的知识和概念来说是不够的。幸运的是,这些概念只是帮助我们理解数据科学理论的补充,而不是我们建立模型所必需的,因为计算机可以为我们处理这些计算和方程。虽然我在整个研究过程中遇到了很多挑战,但我很享受参与其中,因为它与我们的日常生活、未来的学习和工作经历密切相关。

Overall, I found conducting this research very rewarding in two aspects. The first aspect is that this task is interdisciplinary. By analyzing the data and building the models using the computer software, I learned a lot in Statistics, Mathematics, and Computer Science, and I was first exposed to the field of data science. After this program, I realized that my true interest is not pure computer science but data science in which computer science is only a small part of it, mathematics and statistics are other essential parts. Due to this understanding, I decided to change my plan for college major to applied mathematics because I think that better gives me the knowledge about what I want to do in the future.

总的来说,我发现进行这项研究在以下两个方面都很有价值。第一个方面是这项任务是跨学科的,通过分析数据和使用计算机软件建立模型,我在统计学、数学和计算机科学方面学到了很多,我第一次接触到数据科学领域。在这个程序之后,我意识到我真正的兴趣不是单纯的计算机科学,而是数据科学,其中计算机科学只是其中的一小部分,数学和统计是其他重要的部分。  由于这种理解,我决定把我大学专业的计划改为应用数学,因为我认为这能让我更好地了解我将来想做的事情。

The second aspect is that I had a precious time experiencing the environment, culture of UC Berkeley and a typical college student life. I really like the flexi able college life. The facilities and weather there are fantastic and the students there are helpful and brilliant.

第二个方面是,我有一段宝贵的时间去体验加州大学伯克利分校的环境、文化和典型的大学生生活。我真的很喜欢灵活的大学生活。那里的设施和天气都很棒,学生们也乐于助人,才华横溢。

At the end of the study, I developed good friendships with the other two students in my group and Dr. Lan. More surprisingly, I met a relative who was a new student at Berkeley in EECS major just moving into the campus ready to begin his four-year college journey there. With all the beautiful places, memorable experiences, and amazing people there, my desire of studying at Berkeley becomes much stronger.

在研究结束时,我和我们小组的另外两名学生以及 Lan 博士建立了良好的友谊。更令人惊讶的是,我遇到了一位亲戚,他是EECS专业伯克利分校的一名新生,刚搬进校园,准备开始他四年的大学之旅。有了那么多美丽的地方,难忘的经历和令人惊叹的人,我在伯克利学习的愿望变得更加强烈。

Before participating in the research, I had done some work on analyzing the crime situations of different cities in the United States due to my concerns to the society, but my knowledge was not enough for further investigation. Now, this summer’s experience makes me very confident moving forward in my study of crime issues in America. I am currently developing a crime map showing different crime statistics based on the data from official government website by applying the things I have learned in the summer. Hopefully, this will help more people understand the crime situations in America comprehensively and government make better choicesto reduce the crime incidents in the future.

在参与这项研究之前,我做了一些工作来分析不同的城市在美国的犯罪情况,这是源于我对社会的关注,但我的知识不足以作进一步调查。现在,有了今年夏天的经历让我对我在美国犯罪问题的研究有了很大的信心。我目前正在开发一张犯罪图,根据政府官方网站的数据,以及应用我在夏天学到的东西,显示不同的犯罪统计数据。希望这将有助于更多的人全面了解美国的犯罪情况,并为减少未来的犯罪事件做出更好的选择。

 

益升小编有话说

留学是系统工程,涉及方方面面,其中背景提升是最近几年新的名校申请的亮点,也是名校申请的核心要素之一。

加州大学伯克利分校电子计算机科学科研介绍:

加州大学伯克利分校(University of California, Berkeley),是一所位于美国加州旧金山东湾伯克利的公立研究型大学。其许多科系位于全球大学排行前十名,是世界上最负盛名的大学之一。伯克利加大曾有72位教职员或学生为诺贝尔奖得主、9位沃尔夫奖、13位菲尔兹奖、22位图灵奖、45位麦克阿瑟奖、20位奥斯卡金像奖及14位普立兹奖得主。

 

面向对象:以欲申请美国名校电子信息、计算机、自动化等相关专业的高中生为主;

科研主题:计算机科学与程序设计(计算机科学简介、程序设计入门、Python 程序语言、初等算法和数据结构、机器学习和数据挖掘初步等)

软性背景:有一定的科研履历者优先;

科研导师:UCB – EECS类专业导师;

科研地点:UCB 科研组会议室;

 

 

科研起源:

在最新的世界学术水平排行榜中,绝大部分都是美国的大学。由于美国大学与工商业、企业结合紧密,同时学校的教学资源、实验课题及实验设备都属于全球顶尖状态,从而成为众多留学生的梦想留学目的地。

目前中国学生申请赴美留学人数日益剧增,以往美国顶尖名校选择录取GPA高分学生,后来校方逐渐发现学生在学习中缺少创新和实操的能力,进而导致美国名校录取率的下降。近些年,招生官对选择学生时更加看重的是自主创新、专业技能、思维创造才能等综合素质人才。对于计划入读美国名校的学生,实际的科研经验无疑可以提升竞争力,从而大大增加被名校录取的概率。

加州大学伯克利分享EECS高端科研项目,坚持为更多有梦想的学生提供机会和平台。

 

 

科研活动的亮点

1. 进入美国名校实验室/科研组,接触尖端科学

为未来赴美深造做准备;科研经历是美国名校申请的基石,顶级名校的科研项目是对学生有能力完成名校学业最好的证明;

2. 师从导师开展实验项目

高层次的人脉和校友关系,与学生为伍的人是诺贝尔奖获得者、美国科学院院士、教授、名校博士、硕士,学生将体验到世界最顶级学术专家们的思想和气质;

3. 获得导师推荐信和科研证书;

对于优秀学生可以获得名校导师的推荐信,大大助力未来的留学申请;

4. 全天候专业英语环境,迅速提升专业水平;

提升沟通和专业英语水平,提升专业知识和能力,用实践使学生的理论知识更加具体形象;

5. 高含金量收获助力未来留学深造及就业

在名校导师指导下的科研过程将帮助学生明确自身发展方向,不断深化对于美国学界的了解与认同,帮助参与学生及家长明确未来的学校及专业申请方向;从而更好的明确留学的目的与意义,摆脱盲目,获得真知;

 

科研内容简介:

该研究计划旨在让对EECS与工程领域有兴趣的学生对EECS有全面详尽的了解,并且能够初步入门。科研与材料将采用伯克利大学相同的内容,每位学生都能和导师个性化咨询交流,有针对性地进行指导。

该研究将介绍计算机科学重点概念的讲解,入门和巩固程序设计的技术。学生将会学习初等的算法和数据结构,为接下来的深入学习打下基础。同时,学生将会探究学习机器学习领域的基础知识,并且将有机会接触到深度学习等前沿技术。

实践是学习的重要一环,该研究计划将辅导学生的编程实践能力,包括 Python 程序语言、LeetCode 在线算法测试和 Kaggle 数据挖掘竞赛等。

科研完成时,学生将会全面了解伯克利工程科研的培养流程,并对EECS专业有一个完整的认知,对学生今后的专业选择或者人生规划有很大的助益。

 

科研内容:

研究模块 1 —- Programming Intro (编程入门)

编程是学习EECS科研的一个重要组成部分,无论是基础的算法和数据结构,还是进阶的人工智能、网络、系统和安全,都需要学生具备扎实的编程基础,因此编程的重要性不言而喻。然而,大部分大学科研都假定学生将会在选修科研之前自行学习入门编程,因此在进入本科科研之前具备编程基础,对学生的学习将大有助益。导师将会借鉴伯克利 CS 61A 科研的内容,用最新的内容引导学生,最终学生将能用 Python 语言独立完成项目作为模块的总结。

 

研究模块 2 —- Algorithm and Data Structures (算法与数据结构)

算法和数据结构是EECS的核心,这个模块将会重点讲解算法的重要概念——时间复杂度和空间复杂度,以及基本的算法和数据结构,例如搜索、排序、动态规划、数组、链表、队列、栈等等。导师同时提供伯克利的海量资源供学生参考。学生将能独立解决算法问题,对日后的专业学习都大有裨益。

 

研究模块 3 —- Big Data (大数据)

大数据技术(包括计算机视觉、无人车等等)是当前硅谷最热门的领域,模块将会重点介绍大数据时代下机器学习和数据挖掘技术。学生将学习基础的机器学习算法和概念,并在国际著名的大数据竞赛平台Kaggle 接触一手的大数据。导师将指导学生在 Kaggle 参加并完成 MNIST 任务。

 

研究模块 4 —- Deep Learning (深度学习)

承接上一模块的内容,学生将有机会接触最新的深度学习技术以解决大数据问题。重点讲解人工神经网络、反向传播算法、卷积神经网络等概念,并编写代码,利用 MNIST 数据集,完成手写数字识别的任务。

 

科研进程

Section Contents
Section1 介绍 UC Berkeley CS Division 的总体概况,计算机科学概览,答疑

[Lecture] Overview of UC Berkeley CS Division
· Ice-breaker
· Basics of Computer Science — Theory, AI, Database, Networking,

……

Section 2 介绍程序设计基本概念,开始指导学生实践

[Lecture]

· Control & Expressions

· Discussion: Control and Higher Order Functions

……

Section 3 函数与递归

[Lecture]

· Discussion: Environment Diagrams and Recursion
[Lab]

· CS 61A Lab 2

Homework 2

Section 4 数组、链表、字典,复杂度分析

[Lecture]

· Array, List, Dictionary

· Asymptotic analysis

[Lab]

· Leetcode: 2Sum, 3Sum, 3Sum Closest, 4Sum

Section 5 排序:插入排序、归并排序、冒泡排序

[Lecture]

· Sorting algorithms

[Lab]

· Leetcode: Insertion Sort List, Merge Two Sorted Arrays, Merge Two Sorted Lists, Merge k Sorted Lists, Sort List, Kth Largest Element in an Array

Section 6 分治法与动态规划

[Lecture]

· Divide-and-conquer

· Dynamic programming
[Lab]

· Leetcode

Section 7 Kaggle 与 MNIST 入门

[Lab]

· Kaggle and MNIST

· Jupyter, sklearn

Read linear regression, Logistic regression, SVM

Section 8 线性回归、Logistic 回归、支持向量机

[Lecture]

· Linear regression

· Logistic regression

· SVM

[Lab]

· Keras

Read Neural Networks and Deep Learning

Section 9 机器学习进阶:深度学习

[Lab]

· MNIST using convent

Section 10 最终成果总结,导师一对一反馈

[Discussion]
· Project wrap-up
· One-on-one feedback

 

 

科研的收获:

1. 体会伯克利快节奏的学术氛围,挑战自身能力;

2. 拓宽学生视野。伯克利的计算机学术排名长期处于美国前四,而且坐落于世界信息产业的核心地带——硅谷,具有浓厚的创新创业氛围;

3. 学生将有机会与顶尖教授零距离交流,了解学术界和工业界的前沿风向;

4. 学生将在进入大学学习前,全面了解伯克利和其他顶级美国大学计算机系的培养流程,并对专业有完整的认知,不仅为大学打下一个良好的基础,也对学生今后的专业选择或者人生规划有很大的助益。

常见问题:

 

Q: 为何许多“优秀学生”拥有高分却拿不到名校本硕博录取?

A: 家长们存在着很多这样的疑问是可以理解的。在中国式教育思维里,分数是无比重要的,有了分数就能证明一切,但是在申请留学时会发现,有些时候并不是这样。数据显示,现在很多优秀学生即使拥有高GPA、高分TOEFL和GRE成绩,也很难成功申请到美国名校研究生录取。在工作期间,我们接待了很多国内985、211名校的大学生。很多大学生和家长都希望能够申请到好的大学,但是美国顶尖大学每年的招生名额是极为有限的。再加上纽约时报大篇幅报道中国学生成绩单造假事件;TOEFL替考、SAT泄题事件频发;留学申请中的PS、CV和推荐信大部分都是中介机构代劳的现状;连在美国开设替中国留学生写作业的机构都发展的如火如荼;美国教授希望录取到真才实学的学生。是骡子是马,到实验室或科研组来遛遛,如果学生真的品学兼优,4年100万人民币的奖学金也会给到学生。所以,目前的申请阶段,真正优秀的学生必须具备托福GRE分数的同时,拥有货真价实的科研履历,名校推荐信。而这些,正是美国名校科研项目可以给予学生的。

 

Q: 美国名校科研项目对学生的意义何在?

A:

(1)未卜先知——未来研究生学习生活预演。提前预知自己是否适合学术科研,为未来是走学术路线还是企业路线提供参考;

(2)未雨绸缪——拓展学术人脉。一般的科研组都是一个教授+2个博士后+4到6个高年级博士,这些组里的博士都是经过层层选拔的学术精英,未来2年大部分都是全美各大名校的助理教授,提前结识他们对自身日后发展大有裨益;

(3)淋漓尽致——PS、CV有实质性内容。留学申请时的个人陈述和简历有强悍素材了,无论是自己DIY还是留学机构的后期老师都可以发挥学术文笔了;

(4)锦上添花——获取导师推荐信,一份真实而有效的推荐信,将大大增加参与科研的学生后期名校录取的概率;同时,学生在科研结束后,还将获得一份科研证书;

(5)查缺补漏——明确自身短板所在;真正了解自己的能力不足,回国后有针对性加强,助力未来硕博读书顺畅度;

(6)捷足先登——提升硕博录取几率。前面几点都做到了,想不提升录取难度都难。

 

Q:参加美国名校科研项目后,是否有证书或者推荐信?

可以获得美国高等教育协议颁发的科研证书。同时,认真参与科研的学生,还将获得一封推荐信。美国名校科研组中的美国名校导师非常乐于为美国大学推荐优秀学生。但这并不是他们的义务。请注意:虽然超过95%的美国名校科研项目组的学员获得了导师的推荐信,其中每年也有科研后直录的许多案例,但这并不意味这你被项目录取后就可以放松自己,你仍然需要付出努力来证明自己的品质。通常由于一个研究小组中由5人组成,导师一般不会拒绝为你写推荐信的要求。但如果你并没有在研究过程中体现出你的努力和认真,相信推荐信不会对你申请大学有太多帮助。

Leave a Comment