Los primeros años de su vida los pasó en Gaylord, donde se graduó de la secundaria en 1932. Desde joven, Shannon mostró una clara inclinación hacia las cosas mecánicas. Resaltaba respecto a sus compañeros en las asignaturas de ciencias. Su héroe de la niñez era Edison, con quien luego descubrió que tenía un parentesco y a cuyas investigaciones se aproximó bastante.
En 1932 ingresó en la Universidad de Míchigan, donde su hermana Catherine se doctoró como matemática. En 1936 obtuvo los títulos de ingeniero eléctrico y matemático. Su interés por la matemática y la ingeniería continuó durante toda su vida.
En ese momento surgió su interés hacia los circuitos de relés complejos. Intentando simplificar centralitas telefónicas de relés, se dio cuenta de que estos podían usarse para hacer cálculos. Sumado esto a su gusto por la lógica y el álgebra booleana, pudo desarrollar esta idea durante el verano de 1937, que pasó en los laboratorios Bell en la ciudad de Nueva York.
Álgebra booleana y circuitos digitales
En su tesis doctoral en el MIT[4] demostró cómo el álgebra booleana se podía utilizar en el análisis y la síntesis de la conmutación y de los circuitosdigitales. La tesis despertó un interés considerable cuando apareció en 1938 en las publicaciones especializadas. En 1940 le fue concedido el Premio Alfred Nobel para ingenieros estadounidenses por parte de la Sociedad Estadounidense de Ingenieros Civiles de los Estados Unidos, otorgado cada año a una persona de no más de treinta años. Un cuarto de siglo más tarde, Herman Goldstine, en su libro Las computadoras desde Pascal hasta Von Neumann, citó su tesis como una de las más importantes de la historia que ayudó a cambiar el diseño de circuitos digitales.
Durante el verano de 1938 realizó trabajos de investigación en el MIT y le fue concedida la beca Bolles cuando trabajaba como ayudante de enseñanza mientras realizaba un doctorado en matemática. En 1940 estudió un máster en ingeniería eléctrica y se doctoró en filosofía de la matemática.
Durante este período Shannon trabajó en muchas áreas, y lo más notable fue todo lo referente a la teoría de la información, que se publicó en 1948 con el nombre de Una teoría matemática de la comunicación. En este trabajo se demostró que todas las fuentes de información (telégrafo eléctrico, teléfono, radio, la gente que habla, las cámaras de televisión, etcétera) pueden medirse, y que los canales de comunicación tienen una unidad de medida similar, determinando la velocidad máxima de transferencia o capacidad de canal. Demostró también que la información se puede transmitir sobre un canal si y solamente si la magnitud de la fuente no excede la capacidad de transmisión del canal que la conduce, y sentó las bases para la corrección de errores, supresión de ruidos y redundancia.