Proteinler, amino asitlerin zincir halinde birbirlerine bağlanmasından oluşan büyük organik bileşiklerdir. Bu zincirde bir amino asitin karboksil grubunun bir diğerinin amino grubuna bağlanmasıyla oluşan bağ peptit bağı olarak adlandırılır. Her proteindeki amino asit dizisinin sırası bir gen tarafından tanımlanır ve genetik kod ile kodlanmıştır. Genetik kod 20 "standart" amino asit tanımlasa da proteinlerdeki amino asitler translasyon sonrası değişimle kimyasal olarak değişikliğe uğrar. Bu değişimler ya proteinin işlev görmeye başlamasından önce gerçekleşir ya da kontrol mekanizmalarının parçası olarak, proteinin işlevini değiştirmek için olur. Proteinler belli işlevleri yerine getirmek için beraberce de çalışabilirler ve bazıları bir araya gelip kararlı kompleksler oluşturabilir.

Polisakkaritler, nükleik asitler ve yağlar gibi biyolojik makromoleküllere benzer şekilde, proteinler de canlı organizmaların temel bileşenlerindendir ve hücrelerin içindeki her süreçte yer alırlar. Çoğu protein, biyokimyasal tepkimelerde katalizör işlevi olan enzimlerdir ve metabolizma için yaşamsal bir role sahiptir. Başka proteinlerin ise yapısal veya mekanik işlevleri vardır: örneğin hücre iskeletindeki proteinler, hücrenin şeklini koruması için bir iskele görevi yaparlar. Proteinler hücre haberleşmesi, bağışıklık yanıtı, hücre tutunması ve hücre bölünme döngüsünde yer alır.

Protein, beslenmemizin önemli bir parçasıdır. Hayvanlar her amino asiti sentezleyemediklerinden, zorunlu (esansiyel) aminoasitleri gıda yoluyla almak zorundadırlar. Sindirimde hayvanlar yedikleri proteini serbest amino asitlere parçalayıp bunlarla yeni proteinler sentezler.

"Protein" sözcüğünün kaynağı, Yunanca'nın "birincil öneme sahip" anlamını taşıyan πρώτα (prota) sözcüğüdür. Bu isim, proteinleri 1838'de ilk tanımlayan Jöns Jakob Berzelius tarafından verilmiştir. 1926'da James B. Sumner'in üreaz enziminin bir protein olduğunu göstermesine kadar, proteinlerin canlılar için ne derece önemli olduğu tam anlaşılmamıştır. Yapısı çözülen ilk proteinler arasında insülin ve miyoglobin bulunur ki, insülin için Sir Frederick Sanger 1958'de, miyoglobin için de Max Perutz ve Sir John Cowdery Kendrew 1962'de Nobel Kimya Ödülü kazanmıştır.[1] Her iki protein de kırınım analizi ile üç boyutlu yapıları çözümlenen ilk proteinlerdendir.[2]

Proteinler, 20 farklı L-alfa-amino asitten oluşmuş lineer polimerlerdir. Tüm amino asitler, bir alfa karbonuna birer karboksil ve amino grubu ve bir yan zincirin bağlanıyor olması gibi ortak yapısal özelliklere sahiptir. Bir tek prolin, yan zincirinin amino grubuyla bir halka oluşturması yüzünden biraz farklılık gösterir: bu yüzden, CO-NH amit dizisi sabit bir şekle zorlanır.[3] Standart amino asitlerin listesinde ayrıntıları verilmiş olan yan zincirlerin farklı kimyasal özellikleri proteinlerin üç boyutlu yapısını belirler ve dolayısıyla protein işlevine etki eder. Bir polipeptit zincirdeki amino asitler bir dehidrasyon tepkimesi sonucu oluşan peptit bağı ile birbirlerine bağlanırlar. Protein zincirine dahil olmuş amino asit birimlerine "kalıntı" (residue); karbon, azot ve oksijen atomlarından oluşan tekrarlayan diziye de "ana zincir" ya da "protein omurgası" denir. Peptit bağının iki rezonans formu vardır ve bunlar ona kısmî çift bağ özelliği kazandırarak, ekseni etrafında dönmesini engeller. Bu yüzden de alfa karbonlar eşdüzlemseldir. Peptit bağdaki diğer iki dihedral açı protein omurgasının yerel şeklini belirler.

Her bir amino asitin kimyasal yapısı nedeniyle, protein zincirinin bir yönü vardır. Proteinin serbest bir karboksil grubuna sahip olan ucu, "karboksi ucu" (C ucu) ya da "karboksi terminali" (C terminali); serbest bir amino grubu olan ucu ise "amino ucu" (N ucu) ya da "amino terminali" (N terminali) olarak adlandırılır.

"Protein", "polipeptit" ve "peptit" sözcüklerinin kullanımında bir muğlaklık vardır. "Protein" genelde kararlı bir şekle sahip olan bütün biyolojik molekül için kullanılır. "Peptit" ise genelde kararlı bir üç boyutlu yapıya sahip olmayan, kısa amino asit oligomerleri için kullanılır. Ancak bu iki terim arasındaki sınır belirsizdir ve genelde 20-30 kalıntı dolayındadır.[4] "Polipeptit"se, uzunluğundan bağımsız olarak, herhangi bir amino asit zinciri için kullanılır ve sıklıkla da tanımlı tek bir biçimin olmadığına işaret eder